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序 言 


代数 特征 值 问题 的 解法 长 期 以 来 对 我 有 一 种 特殊 的 魅力 ， 因 
为 它 充分 地 显示 出 所 谓 经 典 数 学 与 实用 数值 分 析 之 阅 的 差异 . 特 
征 值 间 题 惧 有 效 似 简单 的 提 法 ， 而 且 其 基本 理论 多 年 来 已 为 人 们 
所 熟知 ;然而 欲求 其 精确 解 就 会 遇 到 各 种 挑战 性 问题 。 

L. Fox 教授 与 E.F. Goodwin 博士 基于 我 在 计算 机 上 工作 的 
早期 经 验 ,建议 我 写 一 本 关于 这 个 主题 的 书 , 纳 人 数值 分 析 专 著 从 
世 , 如 果 不 是 开 . J. Givins 教授 激 请 我 参加 1957 年 于 底特律 召 
开 的 矩阵 讨论 会 ， 因 而 相 急 被 邀请 在 密 执 安 大 学 举办 的 夏季 讨论 
班 作 题 为 解 线性 方程 组 及 计算 特征 值 和 特征 向 量 的 实际 技巧 ”的 
讲演 ， 押 写本 书 向 怕 只 能 是 一 个 良好 的 愿望 。 每 年 为 这 些 讲演 提 
供 一 套 讲义 的 规定 业已 证 明确 有 特定 的 价值 ， 本 书 的 许多 材料 就 
是 以 这 种 方式 通过 讲演 得 以 介绍 . 

我 原来 的 意图 是 叙述 解 此 问题 的 大 部 分 已 为 人 们 知晓 的 技巧 
以 及 对 其 优点 作出 评价 ， 并 尽 可 能 附 以 相应 的 误差 分 析 。 基 于 上 
述 想法 的 原稿 于 1961 年 差不多 就 完成 了 ， 然 而 ,在 准备 原稿 的 那 
段 时 间 内 ,特征 值 问题 与 误差 分 析 获 得 了 重大 进展 ,使 我 对 原先 的 
名 章 日 益 感到 不 满 . 1962 年 我 决定 按照 业已 改变 的 客观 情况 改写 
全 书 . 我 感到 ， 要 包含 几乎 所 有 的 已 知 方法 并 给 出 它们 的 误差 分 
本 已 不 再 切合 实际 ， 因 此 决定 主要 撤 述 我 有 着 广泛 实际 经 验 的 那 
些 方法 。 同时， 我 插 进 附加 的 一 章 ,给 出 相当 一 般 的 误差 分 析 , 它 
适用 于 后 面 提出 的 几乎 所 有 的 方法 .多 年 的 经 验 使 我 确信 , 一 种 方 
法 ， 如 果 没 有 使 用 过 ,就 很 难 对 它 作出 可 靠 的 评价 ,并 且 一 个 实际 
过 程 在 细 池 方面 的 相当 微小 的 变动 常常 会 对 此 方法 的 效果 产生 很 
大 的 影响 ， 

写 数值 分 析 书 的 作者 盏 临 着 一 个 特殊 的 困难 问题 ， 这 就 是 如 


站 


何 确定 该 节 的 读者 对 象 ， 特 征 值 问 题 的 实用 性 沦 述 可 能 使 许多 人 
都 感 兴趣 ， 其 中 包括 设计 工程 师 、. 理 沦 物 理学 家 、 经 典 应 用 数学 家 
以 及 那些 旨 在 矩阵 领域 进行 研究 的 数值 分 析 家 。 一 本 主要 面向 后 
一 类 读者 的 书 可 能 会 使 前 一 类 读者 感到 难以 接受 . 我 不 会 单纯 因 
某 些 读者 可 能 感到 太 困难 而 省 略 掉 任 何 东西 ,但 是 只 韶 题 材 许可 ， 
我 尽量 把 一 切 写 得 初等 一 些 。 左 右 为 难 的 处 境 在 第 一 章 中 表现 得 
最 为 突出 .我 希望 ,那里 所 采用 的 初等 叙述 不 至 于 冒犯 严谨 的 数学 
家 ,而 且 如 果 他 还 拟 从 本 书 其 余部 分 汲取 营养 ,那么 希望 他 把 这 仅 
仅 看 作 是 他 所 熟悉 的 经 典 材 料 的 一 种 粗浅 表示 。 我 从 一 开始 就 假 
定 读者 熟悉 向 量 空间 、 线 性 相关 以 及 秩 的 基本 概念 。 对 于 本 书 内 
容 而 言 ，L. Fox 的 《数值 线性 代数 引 论 》 (Oxford， 本 从 书 之 一 ) 
是 一 部 极 好 的 人 门 书 .在 此 领域 中 的 研究 工作 者 将 在 A. S，Hon- 
seholder 的 《数值 分 析 中 的 矩阵 论 》(Blaisddl，1964 年 ) 一 书 中 找 
到 非常 珍贵 的 资料 。 

前 面 业已 提 到 ,我 决定 只 讲述 那些 我 具有 广泛 经 验 的 方法 ,这 
就 难免 使 得 一 些 重要 的 算法 被 省 略 掉 。 然 而 ， 这 些 省 略 的 严重 性 
实际 上 也 许 是 比较 小 的 ， 因 为 Darand 的 著作 《代数 方程 数值 解 》 
《Masson,1960 年 ，1961 年 ) 以 及 D. K. Faddeer 与 V,N. Fadde- 
eva 的 著作 《线性 代数 计算 方法 》(Moscow，1963 年 ) 提出 了 非常 
广泛 的 叙述 。 不 过 有 两 处 省 赂 需要 特别 提 到 ， 第 一 处 是 由 P. 1 
Eberlcin 发 展 的 Jacobi 型 方法 以 及 由 是，Rutishauser 独立 地 发 
展 的 Jacobi 型 方法 的 各 种 变型 . 我 认为 , 这 些 方法 有 意外 地 成 功 
的 希望 或许 正 好 能 提供 一 般 特征 值 问 题 的 最 满意 的 解 。 倘若 不 
普 先 对 它们 先行 应 有 的 详细 研究 ,那么 我 不 愿意 将 它们 包括 在 内 ， 
因为 不 能 直接 用 我 所 给 出 的 一 般 误差 分 析 来 概括 它们 ， 这 一 认识 
更 坚定 了 我 的 决心 。 第 二 处 省 略 是 Rutishauser 关于 8D 算法 的 
一 般 论 述 , 它 有 很 广泛 的 应 用 .我 觉得 ,我 不 能 在 特征 值 问 题 的 局 
部 范围 内 对 此 项 工作 做 出 完全 公正 的 评价 。 读者 可 参阅 Rutisha- 
wer 与 Henrici 的 论文 。 特 征 值 问题 的 文献 非常 丰富 ， 我 抬 文献 
目录 主要 限于 正文 中 直接 引用 过 的 那些 文章 。 前 面 担 到 过 的 Fe- 


ddeey 与 Faddeeva 的 书 以 及 Housebolder 的 书 都 有 非常 详细 的 
文献 目录 可 资 和 用 。 

在 改写 本 书 时 ,我 曾 试图 把 算法 用 ALGOL 语言 表 出 , 但 后 
来 我 断定 ,要 提供 一 个 在 每 个 细节 上 都 是 正确 的 过 程 ,其 轩 难 在 现 
阶段 是 无 法 克服 的 . 因此 ,我 使 用 了 经 典 数学 的 语言 ,而 采用 一 种 
易于 翻译 成 ALGOL 语言 以 及 有 关 的 计算 机 语言 的 文字 形式 . 

本 书 取材 广泛 ,而 密 执 安 大 学 夏季 讨论 班 对 我 有 显著 的 影响 ， 
特别 是 F. L. Bauer, G. E. Forsythe, J. W. Givens, P. Henrici, 
人 入. S.Householder，O，Taussky，J、Todd 区 及 R. S， Vargs 等 人 
的 工作 。 除 此 之 外 、 昌 .Rutishauser 在 算法 方面 的 才能 是 我 灵感 
的 主要 源泉 。 

(致谢 略 } 
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第 一 章 理论 基础 
引言 


1 在 这 第 一 章 中 ， 我们 将 对 标准 型 的 经 典 理论 以 及 本 书后 面 
将 要 用 到 的 其 他 若干 理论 问题 作 一 概要 的 叙述 . 
因为 全 面 论述 超出 本 章 范围 ， 所 以 我 们 集中 说 明 一 个 答 阵 的 
特征 系 如 何 与 其 他 各 种 标准 型 相 联 系 。 困 此 。 本 书 与 通常 著作 中 
所 讲 的 重点 有 所 不 周 .我 们 不 打算 给 出 所 有 基本 定理 的 严格 证 明 ， 
而 一 般 地 仅 限 于 叙述 其 结果 ， 仅 当 它们 与 后 面 要 用 到 的 实际 技巧 
特别 密切 相关 时 , 才 给 出 其 证 明 。 
为 了 避免 重复 说 明 ， 我 们 在 此 规定 一 些 在 全 书 中 均 将 使 用 的 
车 于 记号 ， 
我 们 用 大 写字 母 表示 和 矩阵, 如 果 不 作 另外 的 说 明 , 和 矩阵 假定 为 
?# 阶 方 阵 , 插 阵 4 的 《六 元 素 记 为 ar。 向量 用 小 写字 母 表示 ， 
一 般 假定 为 + 维 。 向 量 * 的 第 :个 分 量 记 为 = 
单位 矩阵 用 了 表示 ， 它 的 (i,7) 元 素 记 为 556， 即 Kroneker 
符号 ,而 不 用 二。 于 是 我 们 有 
6 = 0 da = 1, (LD) 
7 的 第 i 列 记 为 e:。 用 。 表示 向 量 < 十 o 十 … 十 cs, 它 的 每 
个 分 量 等 于 1 
我 们 将 经 常 碰 到 = 个 向 最 xm，…，xs 组 成 的 向 量 系 。 此 
时 ， 我 们 将 的 第 ;个 元 素 记 为 内 ， 并 将 以 x; 作为 第 i 列 的 
移 阵 记 为 学 ， 对 此 不 责 作 特别 说 明 , 
记号 14| 表 示 (i,7) 元 素 等 于 ez| 的 矩阵 ,记号 
141 < 18] (12) 


意 即 
| < 45 对 一 切 1 (1.3) 


ll» 


由 于 这 一 规定 , 以 及 用 4} 表示 4 的 范 数 ( 见 $52), 所 以 4 的 行 
列 式 将 记 为 det(4)。 据 此 ，(i,i) 元 素 等 于 4 的 (#*Xw) 对 
第 矩阵 ,将 记 为 disg()。 

转 置 答 阵 记 为 47。 其 (i,j) 元 素 等 于 an。 类 似 地 ，x7 表 
示 行 向 量 , 它 的 第 个 分 量 等 于 x**。 因 为 印刷 行 向 量 比 列 向 量 更 
方便 ， 所 以 我 们 将 常常 引进 列 向 量 x， 然 后 用 x 的 显 式 表达 式 
来 表示 它 . 

虽然 在 计算 过 程 中 ,如 有 可 能 在 实数 域 上 讨论 将 更 为 有 利 , 但 
是 我 们 假定 各 处 都 是 在 复数 域 上 进行 讨论 。 


定义 


2. 代数 特征 值 的 基本 问题 就 是 确定 ! 的 和 值 ， 使 得 = 个 未 知 蜡 
的 = 个 齐 次 线性 方程 组 


4x 一 jz (2.1) 
有 非 零 解 。 方 程 (2.1) 可 以 写成 形式 
(4 一 210x 一 0。 (2.2) 
对 任意 的 1， 这 个 方程 组 只 有 解 x 一 0。 根 据 联 立 线性 代数 方程 
组 的 一 般 理 论 ， 当 且 仅 当 和 矩阵 〈4 一 47) 为 坷 异 时 存在 非 零 解 ， 
亦 即 
da(A ~— 11) = 0. (2.3) 
展开 方程 (2.3) 左 端 的 行列 式 ,得 到 显 式 的 多 项 式 方程 
mm 十 ai 十 .十 alo 十 (一 De 一 0。 (2.4) 
方程 (2.4) 称 为 矩阵 4 的 特征 方程 ， 方 程 左 端的 多 项 式 称 为 特征 
多 项 式 . 因为 *” 的 系数 不 为 零 ， 而 且 我 们 假定 名 处 都 是 在 复数 
域 上 进行 讨论 ,所 以 此 方程 总 有 ”个 根 ， 一 般 而 言 ,即使 矩阵 4 是 
实 的， 其 根 也 可 能 是 复 的 ,而 且 根 的 重 数 可 以 是 任意 的 ,一 直到 = 
重 . 这 ”个 根 称 为 矩阵 4 的 特征 值 或 古 有 值 . 
对 应 于 每 个 特征 值 4。 方程 组 (2.2) 至少 有 一 个 非 零 解 + 
这 祥 的 解 称 为 对 应 于 此 特征 值 的 等 征 商 基 或 男 有 向 量 。 若 矩 阵 
(4 一 17) 的 秩 小 于 (# 一 1)， 则 有 一 个 以 上 瘤 立 向 量 满 足 方程 
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《2.2)。 关于 这 点 我 们 将 在 $6~$9 中 详细 讨论 ， 显 然 ,着 “是 方程 
(2.2) 的 解 , 则 对 任何 一 值 tkx 也 是 解 。 因 此 , 即使 (4 一 2 站 
的 秩 等 于 (= 一 1), 对 应 于 2 的 特征 向 量 可 以 相差 一 个 常数 因子 ， 
可 以 选取 这 个 因子 使 得 特征 向 量具 有 所 需要 的 数 信 特 性 ， 这 样 的 
向 量 称 为 规范 化 向 量 .规范 化 的 最 方便 形式 有 以 下 几 种 : 

(i) 分 量 的 模 之 平方 和 等 于 1 

(i) 向 量 的 按 模 最 大 分 量 等 于 1 

《ii) 分 量 的 模 之 和 等 于 1 

规范 化 (i》 与 《 进 ) 的 缺点 在 于 可 以 相差 一 个 模 为 1 的 复 
数 因子 。 

本 书 所 述 的 许多 方法 ,其 第 一 步 是 导出 非 规 范 化 的 特征 向 量 . 
道 常 将 这 些 向 量 乘 以 10 (或 2) 的 短 次 ,使 得 最 大 的 元 素 按 模 界 于 


0.4 与 10 ( 荆 士 与 1 ) 之 间 。 经 过 这 样 处 理 的 向 量 称 为 标准 化 
向 量 . 


转 置 短 阵 的 特征 值 与 转 征 向 量 


3. 转 置 拭 阵 的 特征 值 与 特征 向 量 在 一 般 理论 中 是 相当 蛋 要 
的 ， 根 据 定义 ，47 的 特征 信 就 是 使 得 方程 组 
LT 一 127 (3.1) 
有 非 零 解 的 那些 + 的 值 , 亦 即 使得 
det{AT— A1) 一 0 {3.2) 
的 那些 值 。 因 为 矩阵 的 行列 式 等 于 其 转 置 抑 阵 的 行列 式 ， 所 以 
47 的 特征 值 与 4 的 特征 值 相同 ， 它们 的 特征 向 量 一 般 是 不 相同 
的 .我们 通常 用 4 表示 47 对 应 于 % 的 特征 向 量 , 亦 即 
ATy; = Weys {3.3) 


方程 (3.3) 可 以 写成 为 
A= 7, (3.4) 

所 以 好 有 了 时 称 为 4 对 应 于 4 的 左 特征 向 量 ,而 满足 
Axi 一 ixs (3.5) 


3. 


的 向 景 称 为 4 对 详 于 和 4 的 右 特征 向量 。 转 置 答 阵 的 特征 向 
量 的 午 要 性 主要 来 自 下 列 结 果 。 

设 mr 是 4 对 应 于 特征 值 的 特征 向 量 ，? 是 47 对 应 于 
和 的 特征 向 量 , 则 


#7y1 m0 ( 着 和 2)。 (3.6) 
事实 上 ,我 们 可 以 将 (3.5) 写 为 
27 AT = xf, {3.7) 
并 且 我 们 有 
AYyi ~ biyis {3.8) 
{3.7) 右 杰 以 yi，(3.8) 左 乘 以 x 六， 相 减 得 
0 一 zy — Hxfyis (3.9) 
由 此 导出 方程 (3.6). 


注意 ， 因 为 凡 与 (或 ) y; 可 以 是 复 向 量 ， 节 7% 不 是 通常 理 
解 的 内 积 。 事 实 上 ,我 们 有 的 是 


TH = Fx (3.10) 
而 不 是 
sy 一 CF). (3.11) 
当 =* 是 复 的 时 候 , 我 们 机 以 有 
0 (3.12) 
然而 一 个 真正 的 内 积 , 对 于 一 切 非 零 x， 它 总 是 正 的 。 
不 相同 的 转 征 值 


4. 当 = 个 特征 值 各 不 相同 时 ,特征 系 的 一 般 理论 最 简单 ,我 们 
首先 考虑 这 种 情形 , 记 特 征 值 为 2 j，…，hia。 对 每 个 为， 方程 
(2.2) 至 少 必 有 一 个 解 ， 所 以 我 们 可 以 假定 存在 一 组 特征 向 量 , 记 
为 ms ma。……，xe。， 我 们 要 证 明 这 些 向 量 中 的 每 一 个 , 除 一 任意 因 
于 外 ,都 是 唯一 的 . 

首先 证 明 ， 这 组 商量 必 为 线性 无 关 。 事 实 上 ,如 若 不 然 , 没 ” 
是 线性 相关 向 量 的 最 小 个 数 ,我 们 可 以 将 向 是 编号 ,使 得 这 些 线性 
相关 的 向 量 为 如 x，，,………， x;。 根 据 假 定 ,它们 之 间 有 关系 式 


ss4. 


Fa 0, {4.1) 


其 中 a 均 不 为 零 ， 显 然 r 之 2， 因 为 按 定义 ,所 有 xi 均 为 非 零 
人 向量。 方程 (4.1) 左 乘 以 4, 我 们 有 


立 or 0, (4.2) 
方程 (4.1) 和 以 4 再 减 去 (4.2), 得 
人 wh dri = 0, (4.3) 
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上 式 中 的 每 个 系数 均 不 为 零 。 方 程 (4.3) 意味 着 zi， ma。 …，zr- 
线性 相关 ， 这 与 假定 相 矛 导 * 记 以 = 个 特征 向 量 线性 无 关 , 它 们 张 
成 整个 = 维 空间 。 因 此 :它们 可 以 作为 一 组 基 用 来 表示 任意 向 量 . 

根据 这 后 一 结论 ,立即 可 推出 特征 向 量 的 唯一 性。 事实 上 , 若 
有 第 二 个 特征 向 量 ” 对 应 于 2 我们 可 写成 


区 ar (4 
其 中 至 少 有 一 个 % 不 为 零 、(4.4) 乘 以 4， 得 
hm = DL lin, (45) 
(4 人 条 以 为 再 从 (45) 减 去 ,我 们 有 
0 = Fah 一 om (4.6) 


5 
又 因 x 线性 无 关 , 从 而 
GAB) 2,3,., 1), 
由 此 得 出 
w=0 (一 2 3 人 (4.7) 
所 以 , 非 堆 的 m 必 为 m。， 这 表明 x 是 六 的 一 个 倍数 。 
类 似 地 可 以 证 明 ，<4 的 特征 向 量 是 唯一 的 并 且 线 性 无 关 .前 
面 我 们 已 经 证 明 
2170 pd), 《4.8) 
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所 以 这 两 组 向 量 构 成 双 正 交 系 。 此 外 ,我 们 有 
#0 i= 1,2,., 0), (4.9) 
事实 上 ,着 4 与 y 正 交 , 则 它 就 与 六 ,yo 都 正 交 , 从 而 
与 整个 = 维 空间 正 交 。 这 是 不 可 能 的 ,因为 x; 是 非 堆 向 旦 . 
方程 (4.8) 与 (4.9) 使 我 们 能 够 将 任意 向 量 "用 二 或 % 显 式 
表 出 ,事实 上 ,着 记 


y 一 立 Qixiy {4.10) 
名 
则 
yr = BY oy; 一 ae (4.11) 
fe 
因此 
keds 《4.12) 
在 上 式 中 ,因为 分 母 不 为 零 ,除法 是 允许 的 。 
相似 变换 
5. 如 果 我 们 选取 六 与 yi 中 的 任意 因子 ,使 得 
ya=l G1,2,.,7), (5.1) 


则 关系 式 (4.8) 与 (5.1) 意 昧 着 以 区 作为 第 i 行 的 秆 了 泗 Y” 是 
以 # 作为 第 i 列 的 答 阵 X 的 逆 .。# 个 方程 组 
Axi 一 Nxt (5.2) 
可 以 窟 成 矩阵 形式 
AX 一 Xdisg(h). (5.3) 
刚才 我 们 已 知 ， 矩 阵 区 的 逆 存 在 ， 并 且 等 于 Y7。 所 以 方程 (5.3) 
给 出 


XAX 一 YT4X 一 diag(hi). {5.4) 

抵 降 4 的 变换 及 “4 及， 其 中 玉 是 非 奇 异 的 ， 称 为 相似 变 澳 ， 
而 矩阵 4 与 下 -4 有 称 为 相似 的 。 相似 变换 无 论 在 理论 上 还 是 在 
实际 上 都 是 极为 重要 的 。 显然 ， 且 4 于 也 是 4 的 相似 变换 。 我 
们 业已 证 明 。 若 垂 阵 4 的 特征 值 各 不 相同 ， 则 存在 相似 变换 将 4 
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化 为 对 角 型 ,变换 重 阵 的 列 等 于 4 的 特征 向 量 ， 反 之 , 若 我 们 有 

HAH — diag( yn), (5.5) 
则 

AH = Hdisg( p;), {5.6) 
这 后 一 方程 意味 着 mw 是 4 的 按 其 种 次 序 排列 的 特征 值 ， 而 态 的 
第 i 列 就 是 对 应 于 w 的 特征 向 量 ， 

短 阵 的 特征 值 关于 相似 变换 是 不 变 的 。 事 实 上 ,有 
dz = hr, 《5.7) 


则 
HiAr = FH-'x, 


由 此 得 出 

RT4(REDxz 一 15， (HAH)HT'z 一 az。 《5.8) 
所 以 特征 值 不 变 , 而 特征 向 量 被 乘 以 

求 矩阵 特征 系 的 许多 数值 方法 ,实质 上 就 是 求 相 似 变换 ,将 一 
般 形 式 的 矩阵 4 简化 为 特殊 形式 的 矩阵 了 ， 使 得 由 4 引出 的 特征 
问题 较 易 解决 . 

相似 关 杀 具有 传递 性 , 亦 即 , 若 

B=HrAH, C= HBH,, {5.9) 


则 
C = HHiAHH, = (HH ACHH,). (5.10) 


一 般 而 言 ， 将 一 般 甜 阵 化 为 某 种 特殊 形式 可 以 用 一 系列 简单 
的 根 似 变换 来 实现 。 


盟 特 征 值 与 一 般 矩 阵 的 标准 型 


人 & 有 一 个 或 多 个 重 特征 值 的 矩阵 ,其 特征 笛 量 系 的 结构 ,与 上 
述 情况 相 比 ， 远 非 如 此 简单 。 不 过 仍 有 可 能 存在 一 个 相似 变换 将 
4 化 为 对 第 型 在 可 对 角 化 时 对 某 一 非 奇异 矩阵 妃 , 我 们 有 

HAH ~ diag(%i). (6.1) 

所 以 1 应 为 4 的 特征 值 ,并 且 每 个 4 必定 出 现 适 当 的 次 数 。 事 
实 上 ， 

H(A— MH ~ HAH— HIH = diag(h — 1), (6.2) 
两 边 取 行列 式 , 我 们 有 


det(EDdet(d — I)det(H) = Th — 1), (6.3) 
由 此 得 


de(A— 11) = (Nh — 4). (6.4) 
所 以 为 是 4 的 特征 方程 的 根 。 将 (6.1) 写成 形式 
AH = Hdiag(%), (6.5) 


我 们 君 到 , 妃 的 列 就 是 4 的 特征 向 量 。 因 为 妃 是 非 奇 异 的 , 它 的 各 
列 是 独立 的 。 例 如 , 设 4 是 二 恒 根 ， 记 吾 的 前 二 列 为 入 与 mm 
则 有 


Axy = Ux Ax 一 Ux, (6.6) 

此 处 x 与 x 是 独立 的 。 从 方程 (6.6) 可 知 ， 由 5 与 x 张 成 
的 子 空间 中 的 任 一 向 量 也 是 特征 疝 量 . 事实 上 ,我 们 有 

(az 十 ox) 一 ahr adr hun 十 oaxzz)。 (6.7) 

能 用 相似 变换 化 为 对 角 型 的 矩阵 。 其 重 很 所 对 应 的 特征 向 量 
有 某 种 不 确定 人性。 不 过 我 们 仍 可 选取 一 组 特征 向 量 ， 使 它们 张 成 
整个 ” 维 空间 ,所 以 它们 可 以 当 作 一 组 基 用 来 表示 任 态 向 量 。 

这 样 ,对 角 矩 隆 


A 一 2 (6.8) 
2 
3 


有 5 个 独立 的 特征 向 量 ce1:，c;，<3，e4， cs。 与 6 的 任 一 组 合 
是 特征 向 量 , 它 对 应 4 一 1; 与 。, 的 任 一 组 合 也 是 特征 向 量 、 
它 对 应 一 2， 对 任 一 相似 于 A 的 矩阵 ,存在 非 奇 异 矩 阵 日 ， 使 
得 

HAH=A. (6.9) 
和 4 的 特征 向 量 是 Hes, es。 Hes, He,, Hes, 头 两 个 的 任 一 组 合 仍 
将 是 4 的 特征 向 量 ， 它 对 应 4 一 1; 第 三 与 第 四 两 个 的 任 一 组 合 
也 是 4 的 特征 向 量 , 对 应 于 4 一 2. 


专 损 特征 向 量 系 
了 . 相 羽 于 对 角 秆 阵 但 有 重 特 征 值 的 矩阵 ， 其 性 质 在 将 多 方面 


Be 


与 具有 不 同 特征 值 的 矩阵 是 相间 的 ， 然 而 ， 并 非 所 有 具有 重 特征 
值 的 矩阵 都 是 如 此 . 
矩阵 


cxa) = |: ,| 0 


有 二 重 特征 值 : 一 a。。 若 x 是 Cx(e) 的 特征 向 量 ,其 分 景 为 x 与 
zy， 则 应 有 
{ (72) 
0x 十 0z = 0, ” 
这 些 方程 表明 x 一 0。 所 以 只 有 一 个 特征 向 量 对 应 于 4 一 a, 即 
向 量 ce， 我 们 可 将 Cx(a) 看 作 是 矩阵 


»-|; ,| (7.3) 
D 证 


当 ->a 时 的 极限 。 当 5 天。 时 ,此 和 矩阵 有 两 个 特征 值 < 与 6， 
对 应 的 特征 向量 是 
1 1 
[ol sl, 


当 5 一 a 时 ,这 两 个 特征 值 与 特征 疝 量 相 了 重合 。 
更 一 般 地 , 若 我 们 定义 矩阵 
ol1 
sl 


Ca) = La], CAa) 一 (7.4) 


上 
~ 


则 Ci(a) 有 一 个 重 数 为 * 的 特征 值 a, 但 只 有 一 个 特征 向 量 
xz 一 ec 我们 可 以 像 证 明 Ci(a) 的 相应 结果 那样 来 证 明 这 一 点 。 
另 一 方面 ， 还 可 以 从 【C.(4) 一 a1] 的 秩 为 (+ 一 1) 这 个 事实 
得 到 证 明 。 (右上 + 一 1 阶 答 阵 的 行列 式 等 于 1.) 转 置 矩阵 
5c:(e)] 也 只 有 一 个 特征 向 量 》 一 c+。 我 们 立即 得 到 


zy = eTer = 1, (7.5) 
这 与 具有 不 同 特征 值 的 矩阵 所 得 到 的 结果 是 不 一 样 的 
和 矩阵 C.(a) (+ > 1) 不 能 用 相似 变换 化 为 对 角 型 . 事实 上 ， 
若 存 在 理 ， 使 得 
HTCH = diag(%i), (7.6) 
亦 邑 
CH ~ Hdiag(hi), (7.7) 
则 根据 $5 所 证 ，x 应 等 于 C.(a) 的 特征 值 , 从 而 所 有 4 均 应 
等 于 s。 于 是 ， 由 方程 (7.7) 可 知 , 矩 降 互 的 各 列 均 为 Cila) 的 
特征 向 量 。 因 为 如 是 非 奇 异 的 ， 所 以 这 些 列 应 是 独立 的 。 因此 关 
于 存在 这 种 矩阵 召 的 假定 是 错 的 。 
和 矩阵 C,(a) 称 为 阶 初等 Jordan 子 矩 降 ， 有 时 称 为 > 阶 初 
等 经 典 子 所 降 ， 下 一 节 我 们 会 看 到 这 种 形式 的 矩阵 在 理论 上 是 非 
常 重要 的 。 


Jordan (经 典 的 ) 标 准 型 


8. 我 们 君 到 ,具有 重 特征 值 的 矩阵 不 一 定 相似 于 对 角 和 矩阵 . 自 
然 要 问 ， 用 相似 变换 可 以 将 矩阵 4 化 为 哪 一 种 最 紧凑 的 形式 . 答 
案 就 包含 在 下 而 定理 之 中 . 

设 4 是 = 阶 和 矩阵 , 有 个 不 同 的 特征 值 44，%,…,4,、。 重 数 
为 ms ma …，mr， 于 是 

z 十 0 士 。 士 mr 一 了 (8.1) 

则 存在 一 个 相似 变换 , 变换 矩阵 为 日， 使 得 矩阵 有 "48 为 初等 
Jordan 子 矩 阵 所 构成 , 这 些 子 矩阵 分 布 在 对 角 线 上 ， 所 有 其 余 元 
素 均 为 去 ， 对 应 于 2 的 那些 了 矩阵 阶 数 之 和 等 于 和 or。 除了 对 
角 线 上 子 和 矩阵 的 次 序 外 ， 变 的 矩阵 是 唯一 的 我们 称 H7'4H 为 
初等 Jordan 子 年 阵 的 直接 和 。 

这 样 ， 一 个 6 阶 矩 阵 , 若 有 5 个 特征 值 等 于 2， 一 个 特征 值 
等 于 如、 并 相似 于 


a0 


Calh) 
CN) 
c= co (8.2) 
Ci) 有 
它 就 不 能 再 相似 于 矩阵 
CN) 
Cb) 
Ci(%,) 

虽然 后 者 也 有 5 个 根 等 于 4 一 个 根 等 于 ja。 由 初等 Jordan 子 
矩阵 所 构成 的 矩阵 称 为 矩阵 4 的 Jordan 标准 型 或 经 典 标准 型. 

作为 一 种 特殊 情况 , 当 Jordan 标准 型 中 的 所 有 Jordan 子 矩 
阵 均 为 1 阶 时 ,此 标准 型 变 成 对 角 和 矩阵、 我 们 已 经 看 到 , 若 矩 阵 的 
特征 值 各 不 相同 , 则 其 Jordan 标准 型 必 为 矩阵 diag(%;)。 

独立 的 特征 向 量 的 总 数 等 于 Jordan 标准 型 中 子 和 矩阵 的 个 数 ， 
这 样 ， 藻 矩阵 4 能 化 为 由 等 式 (8.2) 所 定义 的 C， 则 它 有 4 个 独 
立 的 特征 向 量 。C 的 特征 向 量 是 ,ec;, es, cs， 因而 4 的 特征 庙 
量 是 Ha, He,, Hes, Fee。 特征 值 4, 的 重 数 等 于 $, 但 对 应 的 特 
征 向 基 只 有 三 个 . 

我 们 不 去 证 明 Jordan 标准 型 的 存在 唯一 性 ,因为 证 明 方法 与 
后 面 几 章 要 讲述 的 方法 不 甚 相关 .在 阶 初 等 Jordan 子 和 矩阵 中 ， 
我 们 取 了 对 和 角 线 上 面 一 条 的 元 素 等 于 1, 尚 有 一 种 相应 的 标准 型 ， 
其 对 角 线 下 面 一 条 的 元 素 取 成 等 于 1。 我 们 将 等 式 (7.4) 的 型 称 
为 上 Jordan 型 ,而 另 一 种 型 称 为 下 Jordan 型 。 这 些 元 素 到 值 为 
1 并 宙 有 特殊 合 义 。 显 然 ,用 一个 语 当 的 对 角 第 阶 作 相 你 认 交 ,这 
此 元 素 可 取 任 章 的 非 零 信 . 


《8.3) 


初等 因子 


9. 设 C 是 4 的 Jordan 标准 型 ， 考 虑 矩阵 〔C 一 17)。 例如 ， 
相应 于 等 式 (8.2) 的 矩 降 C， 我 们 有 


alle 


Ch — 1) 
Ct — 4) 
Cio—i) 
Cl 一 如) 

《9.1) 
显然 ， 一 般 地 讲 ,《〈C 一 317) 是 形 如 C,(4i 一 2) 矩阵 的 直接 和 ，。 
标准 型 〈C 一 41) 的 子 矩阵 的 行列 式 称 为 矩阵 4 的 初等 因子 , 这 
样 ,与 等 式 (8.2) 中 的 C 相 似 的 任 一 矩阵 的 初等 因子 为 


《C 一 41 门 一 


(一 (9.2) 
显然 可 见 ,矩阵 的 初等 因子 的 乘积 等 于 它 的 特征 多 项 式 . 当 Jordan 
标准 型 是 对 角 和 矩阵 时 ,初等 因子 为 

人 一 (一 (9.3) 


所 以 它们 都 是 线性 的 ， 具 有 不 同 特征 值 的 逢 阵 ， 其 初等 因子 总 是 
线性 的 ， 但 是 我 们 已 经 看 到 , 若 矩阵 有 ~- 个 或 多 个 重 特征 值 , 则 它 
可 以 有 也 可 以 没有 线 任 初 等 因子 ， 

车 逢 阵 有 一 个 或 多 个 非 线性 初等 因子 ,这 表明 ,在 Jordan 标 
准 型 中 至 少 有 一 个 子 入 降 的 阶 数 大 于 1, 因此 独立 的 特征 向 重 的 


个 数 小 于 "。 这 种 矩阵 称 为 亏损 的 。 


么 的 特征 多 项 式 的 友 矩 阵 
10. 我 们 记 4 的 特征 方程 为 
CD Pod — pest ee po] 0 (10.1) 
容易 验证 ,和 矩阵 
Po- Paap: Po 
1 0.0 0 
CC 一 | 0 1: 0 0 {10.2) 
0 0.1 0 


的 等 征 方 程 与 4 的 特征 方程 相同 ， 短 阵 C 称 为 4 的 特征 多 项 式 的 
友 集 隆 ， 因 为 C 与 4 有 相同 的 特征 多 项 式 ， 自 然 要 间 , 一 般 地 讲 ， 


» 12. 


它们 是 否 相似 ? 不 一 节 我 们 给 出 这 个 问题 的 答案 。 注 意 ， 我 们 可 
以 用 其 他 三 种 形式 给 出 友和 矩阵 。 例 如 ,可 以 取 

000…0 po 

100..0 np 

010…0 p|, (10.3) 


0 001 ps 
或 者 可 以 将 元 素 Pp， 置 于 第 一 列 或 最 后 一 行 ， 而 将 对 角 线 上 面 一 
条 的 元 素 置 1。 我 们 将 把 这 几 种 形式 都 看 作为 友 矩 阵 、 而 应 用 其 
中 最 方便 的 一 种 。 


非 减 次 矩阵 


了 1. 设 算 阵 4 有 不 同 的 特征 值 4, 4,…*, is， 则 4 相似 于 
disg(4)。 我 们 要 证 明 ， 此 时 diag{4) 相似 于 友和 矩阵 .我 们 找 出 
将 C 变换 为 diag(%) 的 矩阵 来 证 明 这 一 点 。 考虑 = 一 4 的 情形 
就 可 充分 显示 出 一 般 的 情形 。 

考虑 矩阵 


对 宙 姑 下 

He 对 好 时 刀 

和 

1111 

若 4% 各 不 相同 , 则 算 阵 是 非 奇异 的 ,我 们 有 
对 对 对 天 
旭 忠 忆 居 


|. (11.1) 


Hdiag( 4;) = |. 11.2 
iag{ ti) 里 虹 虹 必 (11.2) 
hh 
并 且 有 关系 式 
ps pi Pr po 对 对 对 对 
1000 舌 台 民 愉 
有 一 | 革 攻 蚊 六 ， (11.3) 
09100 好 好 对 对 
0010 2 


13 。 


上 式 根据 

WU— p+ pt Pplt pe (11.4) 
可 立即 推 得 。 因 此 

CH = Hdiag{4;), (11.5) 
所 以 C 相 似 于 diag(2)， 从 而 相似 于 为 特征 值 的 任 一 矩阵 . 
现在 转 到 有 几 个 重 特征 值 的 情形 。 我 们 立即 可 见 ， 若 4 有 一 
个 以 上 独立 的 特征 向 量 对 应 于 为 ， 则 它 就 不 能 相似 于 C。 事实 
上 ， 对 于 任意 信 2，(5 一 好 1) 的 秩 至 少 为 = 一 1， 因 为 左下 角 
# 一 】 阶 矩阵 的 行列 式 显然 等 于 !。 对 应 于 特征 信 和 的 特征 向 

量 风 有 


好] (11.6) 
这 一 点 可 以 从 解 方程 组 
(C— uDr=0 (11.7) 
得 到 。 
因此 ， 要 使 一 个 抢 阵 相似 于 其 特征 多 项 式 的 友和 矩阵 ， 必 要 条 
件 是 对 应 于 每 个 不 同 的 特征 什 ，Jordan 标准 型 中 只 含有 一 个 
Jordan 子 矩 阵 。 现在 我 们 证 明 ， 这 个 条 件 也 是 充分 的 。 间 样 只 
要 对 一 种 篇 单 情形 加 以 证 明 就 是 够 了 。 
12. 考虑 一 个 4 阶 和 矩阵, 其 初等 因子 为 (4% 一 2,，(4, 一 4)， 
(4, 一 1)。 这 个 矩阵 相似 于 4 
如】 
0 


4 一 . 1 
4 1 {12.1) 


车 4, 1， ,4 不 相同 , 则 矩阵 
愉 38 居 及 
和 二 | 避 24 如 如 (122) 
hl hl 
1011 
显然 是 非 奇异 的 ,我 们 有 


sl4. 


对 4 得 对 对 
好 3 妈妈 天 
BR4, 一 2 如 4 上 | {12.3) 
hl nh 
因为 4 是 特征 方程 蕊 1) 一 0 的 二 重 根 ， 故 育 ja) 一 0, 由 此 
得 
4 得 一 38 和 十 2 十 六 {12.4) 
因此 
CH= HA,. (12.5) 
完全 类 似 地 ,我 们 可 以 处 理 ” 阶 矩 阵 的 > 阶 Jordan 子 矩 阵 。 
若 是 有 关 的 特征 值 , 则 相应 的 矩阵 娓 有 r 个 列 . 


CT 


1 0 0 


因此 ,车 对 应 于 每 个 不 同 特征 值 % 只 有 一 个 Jordan 子 矩阵 ， 也 
就 是 对 应 于 每 个 不 同 的 特征 值 w 只 有 一 个 特征 向 量 ， 则 此 系 阵 就 
相似 于 其 特征 多 项 式 的 友和 矩阵 ， 这 种 矩阵 称 为 非 减 次 的 。 


Frobenius (有 理 的 ) 标 准 型 


13. 若 对 某 个 i, 对 应 于 的 Jordan 子 和 矩阵 有 一 个 以 上 ( 因 
而 有 一 个 以 上 的 特征 向 姑 ) ,这 样 的 矩阵 称 为 碱 次 的 。 我 们 已 经 看 
到 , 减 次 矩阵 不 可 能 相似 于 其 特征 多 项 式 的 友和 矩阵 ,现在 我 们 研究 


减 次 矩阵 的 类 似 友和 矩阵 那样 的 标准 型 ， 
我 们 定义 + 阶 Frobenius 焦 阵 B 为 如 下 形式 的 矩阵 
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br br bb 


1 000 
za-| 1 .0 ol (13.1) 
8 6 -i 
一 般 矩 阵 的 基本 定理 可 以 表达 如 下 。 


每 个 矩阵 4 可 以 用 相似 变换 化 为 :个 Frobenius 矩阵 ， 记 为 
Bn, 55， …，Br 的 直接 和 。 每 个 Bu 的 特征 多 项 式 能 除 尽 所 有 
位 于 前 面 的 8,, 的 特征 多 项 式 .在 非 减 次 矩阵 的 情况 ,，s 一 1, 且 
一 #。 Frobenios 矩阵 的 直接 和 称 为 Frobenius (或 有 理 的 ) 标 准 
型 。 有 理 标 准 型 的 称呼 来 源 于 这 一 事实 ， 即 它 可 用 4 的 元 素 域 中 
的 有 理 变换 导出 . 

我 们 不 打算 给 出 ”Frobenivs 标准 型 存在 性 的 直接 证 明 , 不 过 
我 们 要 指明 它 与 Jordan 标准 型 的 联系 。 这 并 不 能 说 明 这 一 变换 
的 有 理 本 质 ， 因 为 导出 Jordan 标准 型 的 运算 , 一 般 而 言 , 在 4 的 
域 中 是 无 理 的 . 


Jordan 标准 型 与 Frobenims 标准 型 的 关系 


14. 用 例子 也 许 最 能 说 明 两 种 标准 型 之 闻 的 关系 。 设 一 个 10 
阶 和 矩阵 4 有 下 列 初 等 因子 
(一 人 (一 人 (一 2 
《一 2 (一 1) (14.1) 
(一 办， 
其 Jordan 标准 型 可 写成 
Ch) 
Cl) 


ca) | 


[oo 
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TE Gl | (14.2) 


这 里 我 们 将 每 个 特征 值 所 对 应 的 最 高 阶 Jordan 子 和 矩阵 奉 集 在 一 
起 ,给 出 矩阵 G1:， 然 后 ,次 高 阶 的 诊 集 一 起 给 出 G:， 等 等 。 

所 以 ,每 个 矩阵 G 只 有 一 个 Jordan 子 矩 阵 对 应 于 每 个 bw， 
因而 可 用 相似 变换 且 将 它 化 为 局 阶 的 单个 Frobenius 矩阵 . 在 
本 例 中 ， 

[ren 一 B (6 阶 Frobenivs 从 阵 ) 


Hr7'GsH, 一 B， (3 阶 Frobenius 矩阵 ) (14.3) 
HF'GH, 一 B，(1 阶 Frobenius 矩阵 ) 


Hi G 年 
WA 
Hy! G3 H, 
B。 
-| By | (14.4) 
Bi 


B。 的 特征 多 项 式 是 《4 一 4) (一 1 (一 人 ，B 的 是 
人 一 (4 一 4，B， 的 是 (% 一 2)。 这 些 多 项 式 中 的 每 一 个 
均 为 前 一 个 多 项 式 的 因子 ,这 可 由 G 的 定义 推出 ,在 一 般 情况 下 
此 结论 也 是 成 立 的 。 显然 ， 矩 中 的 者 等 因子 是 frobenius 标准 型 
中 子 矩 阵 的 特征 多 项 式 的 因子 。 注 意 , 若 矩阵 4 是 实 的 , 则 复 特 征 
值 以 复 共 轿 数 对 出 现 。 因此， 每 个 Gt 显然 是 实 的 。 这 是 可 以 预 
料 到 的 ,因为 我 们 已 经 讲 过 。Frobenivus 标准 型 可 由 4 的 域 中 的 有 
理 变换 导出 。 


相抵 变换 
15. 我 们 已 经 看 到 , 短 阵 的 特征 值 关 于 相似 变换 是 不 变 的 。 现 


17。 


因此 


在 我 们 简略 地 考察 一 类 更 广泛 的 变换 。 车 存在 非 亲 必 矩阵 ( 必 为 
方 阵 ) 了 与 9， 使 得 
PAG = B, (15.1) 
则 称 矩 阵 8 与 逢 阵 4 相抵， 注意, 4 与 不 必 为 方 降 , 但 维 数 应 该 
相同 。 根 据 对 应 的 矩阵 定理 〈《 有 时 称 为 Binet-Cauchy 定理 , 例如 
参见 Gantmacher，1959a，Vol- 1)* 可 知 ， 相 抵 的 阵 有 相同 的 秩 . 
我 们 所 讨论 的 相抵 关系 对 解 线性 方程 组 是 很 午 要 的 ,事实 上 ，。 
车 x 满足 


Ar = b, (15.2) 
则 显然 ,对 尾 一 可 相 乘 矩 阵 了 ， 它 也 满足 
PAx— Pb. (15.3) 


其 次 , 车 P 是 非 奇 异 的 , 则 将 (15.3) 乘 以 ”可知 ，(15.3) 的 任 
一 解 也 是 (15.2) 的 解 . 


现在 考虑 变量 代 换 
xz 一 97， (15.4) 
其 中 是非 奇异 矩阵 、 于 是 有 
PAQy 一 pb, (15.5) 


由 《15.5) 的 任 一 解 7 我 们 可 以 得 出 (15.2) 的 解 *， 反 之 亦 然 . 因 
此 ,方程 (15.2) 与 (15.5) 可 以 看 作 是 相抵 的 。 
2 矩阵 


16. 我 们 现在 将 相抵 概念 推广 到 元 素 为 .的 多 项 式 的 第 阵 , 这 
种 矩阵 称 为 短 隆 ， 若 4(2) 是 〈m X n) 姑 阵 ， 其 元 束 是 次 数 
不 大 于 《的 多 项 式 , 则 可 写 为 


(一 4 十 4 十 十 4 (16.1) 


* 中 译本 : 甘 特 马 款 闭 , 柯 召 译 , 拭 阵 论 > 商 等 教育 出 乒 社 ，1951. 
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其 中 44，A4-1，…"，4o 均 为 《m XxX n) 矩阵 元素 不 依赖 于 
2。 逢 阵 的 秩 等 于 这 样 一 些 子 式 的 最 大 次 数 ,这 些 子 式 是 1 的 非 
零 多 项 式 . 

两 个 1 抑 隆 4(1) 与 B(4) 称 为 相抵 ， 如 果 存 在 的 2 方 阵 
P(4) 与 0(4)， 它 们 有 不 依赖 于 2 的 非 零 行列 式 ,使 

POU)AG)GOH) = BND. “ (16.2) 

注意 ,因为 P(X) 有 不 依赖 于 1 的 非 零 行列 式 , 所 以 [PC2)]”* 也 
是 一 个 具有 同样 性 质 的 1 矩阵 。 


初等 运算 


17. 我 们 将 对 下 面 几 种 篇 单 的 非 亲民 的 1 矩阵 P(2) 感 兴 
趣 。 
人 pu(4) 一 1(7 PP，9)，pre(4) 一 par(4) 一 1， 其 余 的 
Pui(2) = 0; 
(人 Pu)= 1 一 1 ，pra(14) 一 1 人 (4), 其余 的 
Pil4) = 03 
《( 诈 ) p24) 二 1(i 天 2)，Pro(4) 一 到 0， 其余 的 Pi(24) 一 
0, 
显然 ,第 (i) 种 矩阵 的 行列 式 等 于 一 1, 第 (ii) 种 的 等 于 十 1， 而 
第 《 诈 ) 种 的 等 于 太 
将 4(4) 分 别 左 汪 以 第 i), (i), (过) 种 矩阵 ,其 效果 为 : 
(i) 第 ? 行 与 9 行 互 换 ， 
(ii) 第 4 行 冬 以 1) 加 到 ? 行 ， 
《ii) 第 ? 行 乘 以 非 零 常数 不 ， 
右 冬 对 列 产生 相应 的 效果 ，4(4) 的 这 些 变换 称 为 初等 运算 、 


Smith 标准 型 

18. 相抵 1 矩阵 的 基本 定理 如 下 : 

每 个 秩 为 > 的 1 矩阵 4(X) 可 用 初等 运算 (4(4) 元 案 域 中 的 
有 理 运算 ) 化 为 相抵 的 对 和 角 型 


= 19 。 


E(2) 
Eat4) 


Dp— E01) ， (8.D 


其 中 每 个 Ei(2) 是 2 的 规格 化 多 项 式 ， 并 且 Ei(X) 能 除 鼠 
Elna(4).( 规 格 化 多 项 式 的 最 高 次 项 系数 为 1.) 除了 Ei(2) 之 外 ， 
DD 的 所 有 元 素 均 为 零 . 

证 明 如 下 :我们 将 用 一 系列 初等 运算 来 导出 对 角 型 ， 并 且 把 
每 一 阶段 中 正在 被 变换 的 矩阵 的 (i, j) 元 素 记 为 ow(2)。 

设 us(24) 是 4(4) 中 次 数 最 低 的 元 素 之 一 , 交换 第 1 行 与 i 
行 及 第 1 列 与 i 列 ,可 将 此 元 素 变 为 元 素 sa(1)。 现在 我 们 令 

上 一 sna(1)9na(2) + ra HG = 2, 3 m), (182) 
ay(1) = an(2)9u(2) +t ri) = 2, 3 9)， 
中 ra(%) 与 ry(1) 是 余 项 , 故 其 次 数 低 于 au(2) 的 次 数 。 车 
不 是 所 有 的 ra(%) 与 ru(%) 均 为 零 ， 则 设 ra(1) 不 是 堆 . 从 
上 行 中 碱 去 第 1 行 乘 以 4o(2)， 并 交换 第 1 行 与 太行. 于 是 元 素 
aa) 变 成 ra(1) ， 它 不 等 于 零 , 并 且 其 次 数 低 于 上 一 次 位 于 此 
处 的 元 素 . 

如 此 继续 下 去 ， 元 素 ea(2) 总 是 不 等 于 零 ,而 其 次 数 则 逐步 
减少 .最 终 , 当 前 的 su(2) 必 能 除 尽 所 有 当前 的 sa(2) 与 (2)。 
这 有 两 种 可 能 :或 者 当 aa(1) 变 成 不 依赖 于 1， 或 者 在 更 早 的 
阶段 。 当 此 情况 出 现时 ， 从 第 2 行 到 ? 行 减 去 第 1 行 乘 以 适当 的 
子 , 然 后 再 从 第 2 列 到 列 减 去 第 1 列 乘 以 适当 的 因子 ,就 可 以 
将 矩阵 化 为 形式 


| “0 Al 


在 这 一 阶段 上 的 au(X) 可 能 除 尽 4X4) 的 所 有 元 索 ， 如 若 


(18.3) 


20. 


不 然 ,假定 对 某 元 素 az(2)》 有 
el( 们 一 aa(2)4i(2) + roa) (CC 天 0)， (184) 
于 是 将 第 i 行 加 到 第 1 行 后 ,我 们 可 以 应 用 上 述 过 程 再 次 得 到 形 
式 (18.3), 其 中 eu(24) 仍然 不 是 零 但 次 数 更 低 。 如 此 继续 下 去 ， 
我 们 一 定 能 达到 形式 (18.3), 其 中 su(2) 能 除 尽 41(2) 的 每 个 
元 素 。 这 种 情况 必定 会 出 现 , 或 者 当 sau(%) 变 成 不 依赖 于 +, 或 
者 在 某 个 更 早 的 阶段 上 . 
车 4a(2) 不 恒 等 于 零 , 我 们 对 此 矩阵 应 用 类 似 刚才 用 于 4(4) 
的 步 最 . 我 们 可 以 设想 。 这 时 的 运算 只 是 对 算 阵 (18.3) 的 第 2 行 
到 mw 行 以 及 第 2 列 到 * 列 进行 ;第 1 行 与 第 1 列 整 个 保持 不 变 ,在 
这 一 步骤 的 各 个 阶段 上 ，4x(1) 的 所 有 元 素 显然 仍 能 被 au(4) 除 
尽 . 因此 ,我 们 得 到 形式 


ea) oO 
| 0 | 


0 on 


0 [4(2) 
其 中 au(4) 能 除 尽 sa(1)， 而 sza(2) 能 除 尽 4;(4) 的 所 有 元 
ER 


(18.5) 


如 此 继续 下 去 ,我 们 得 到 形式 
au(2) | 
owl) : 
. 1° (18.6) 
gu(2) 1 
os 


其 中 每 个 sii(%) 能 除 尽 它 的 后 继 者 ,， 当 “一 m 或 ,或 者 
有 44,4(4) 是 堆 矩 阵 时 ,步骤 中 止 。 但 是 我 们 一 定 有 “一 +， 因为 根 
据 对 应 的 矩阵 定理 ， 当 1 矩阵 乘 以 非 奇 异 隆 时 ， 其 秩 不 变 。 因为 
an(+) 是 非 堆 多项式, 各 行 乘 以 适当 常数 ,可 以 使 得 每 个 多 项 式 中 
最 高 次 项 的 系数 变 为 1， 于 是 ez(2) 就 成 为 规格 化 多 项 式 Bi(1)， 
并 且 每 个 Ei(4) 能 除 尽 Bt(4)， 定 理 证 毕 ， 显 然 ,这 里 只 使 用 


21。 


了 有 理 运 算 ， 因 为 也 是 用 初等 运算 得 出 的 ,我 们 有 

P(2)4(2)O02) = DD, (18.7) 
其 中 P(X) 与 0(X) 都 是 非 奇 异 矩阵 ， 其 行列 式 不 依赖 于 1。 
(18.1) 中 的 了 通常 称 为 相抵 2 矩阵 的 Smith 标准 型 


4 矩阵 的 R 行 子 式 的 最 大 公 因 子 


19. 现在 考察 Smith 标准 型 的 人 行 子 式 。 若 > ，， 则 所 有 
不 行 子 式 均 为 讼 。 反 之 ,唯一 的 非 零 太 行 子 式 就 是 太 个 Bi(2) 的 
村 积 。 因 为 每 个 为 (1) 是 Eva(2) 的 因子 ， 所 以 不 行 子 式 的 最 
大 因子 《简写 为 H，C. F.) Gk(1) 等 于 已 (BC2) EMC 
因此 , 闫 记 G7) 一 1， 则 
ED ~ 2 GD 
我 们 现在 证 明 ,矩阵 的 大 行 子 式 的 BC，F，( 我 们 取 1 的 最 
高 次 项 系数 等 于 1 关于 相抵 变换 是 不 变 的 。 事 实 上 ,着 
PCD4(2)900) = BO), (192) 
则 BC2) 的 任 一 不 行 子 式 可 用 为 形 如 Ps4sQ， 诸 项 之 和 ， 此 处 
P。，4s，Q, 分 别 表示 P(X)，A4(X)，0C4) 的 % 行 子 式 . 因此 ， 
4A(2) 的 大 行 子 式 的 理 , C. FR, 能 除 评 B(2) 的 任 一 站 行 子 式 ， 
然而 ,因为 
40D 一 [PCD]-B(DL90D]-5 
且 【P(D)1-: 与 [9(1)]- 也 均 为 4 拓 阵 ,所 以 BC2) 的 环行 子 
式 的 BC. P, 能 除 尽 4(2) 的 任 一 行 子 式 。 因此 ， 两 个 
H.C.F， 必 相等 。 
这 样 。 所 有 相抵 4 矩阵 具有 要 同 的 Smith 标准 型 。 多 项 式 
Ei(4) 称 为 4(4) 的 不 变 因子 或 不 变 多 项 式 。 


(入 一 4D 的 不 变 因子 
20. 若 4 是 方 阵 , 则 4 一 41 是 秩 * 的 4 佐 阵 , 因此 有 + 个 不 


2 


变 因 子 E(X), EA(X),…,E,(2)， 每 一 个 能 除 尽 后 一 个 。 现在 
我 们 将 4 一 17 的 不 变 因子 与 Frobenius 标准 型 中 Frobenivs 和 矩 
阵 的 行列 式 联系 起 来 。， 设 B 是 4 的 Frobenius 标准 型 ， 次 而 存在 
到， 使 得 


HAH ~ 8B, (20.1) 
所 以 
BA4 一 20) 瑟 一 日 一 3， (20.2) 
因为 矩阵 吾 ”与 五 都 是 非 音 异 的 ， 并 且 与 1 无关, 所 以 B 一 41 
与 4 一 相抵 。 


我 们 现在 考察 B 一 27 的 不 变 因 子 ， 其 一 般 形式 可 用 一 简单 
例题 来 充分 说 明 。 设 B 一 41 的 形式 为 


一 了 B; 一 和 . {20.3) 


由 14 可知, 序列 Sex( 思 一 47,da( B49， da 一 4) 中 
的 每 个 多 项 式 可 被 后 一 个 除 尽 . 

通过 考察 非 零 子 式 。 我 们 看 到 。 ; 行 子 式 的 日，C. F.， 即 
Gr(1)， 是 
Ge) 一 1 ( 按 定 义 )，G:(D) 一 GD) 一 … 一 GD 一 1， 
G1) = det( Bs — 41), Ga) = det( Bs— 11)det( Ba — 41), 
G4) 一 det( Bs— 11)det(Bi— A1)det(B, — 11). 

{20.4) 


* 223+ 


因此 不 变 因子 是 

EC) = E(D)— .= E()= 1; 

E,(4) = det(B;— 41); Es(4) = det{ B,— 41); (20.5) 

E, 一 det( B, 一 147), 
我 们 的 结果 显然 具有 普遍 性 , 所 以 《4 一 41) 的 不 等 于 1 的 不 变 
因子 等 于 Frobenivs 标准 型 中 子 阵 的 特征 多 项 式 。 联系 相似 与 4 
相抵 的 基本 结果 是 : 

4 与 娃 相似 的 充 要 条 件 是 〈4 一 27) 与 (8 一 17) 相抵 .由 
于 这 个 原因 ， (4 一 2 的 不 变 因 于 有 时 称 为 4 的 相似 不 变量 。 

再 由 $ 14 可 知 , 若 记 

EMA) = Ch A A Oo 7, (20.6) 

其 中 hs ,和 h 为 4 的 不 同 特征 值 ， 则 (20.6) 右 端的 因子 均 
为 4 的 初等 因 于 。 


三 角 标准 型 


21. 化 Jordan 标准 异 提 供 特征 值 与 特征 向 量 两 者 的 全 部 信 
息 。 它 是 三 角 标 准 型 的 一 种 特殊 情形 。 后 者 无 论 从 理论 上 还 是 从 
实际 计算 上 都 村 简单 得 多 .其 重要 性 可 由 下 列 定理 以 及 $ 25 中 的 
定理 看 出 。 

每 个 矩阵 相似 于 三 角形 矩阵 ， 亦 即 所 有 位 于 对 角 线 以 上 的 元 
素 全 为 零 的 矩阵 。 我 们 称 这 样 的 矩阵 为 下 三 角形 年 阵 , 与 Jordan 
型 的 情况 一 样 , 男 有 一 种 变换 化 为 对 角 线 以 下 全 为 零 的 年 阵 (上 三 
角形 护 阵 }， 证 明 相当 简单 ,我 们 把 它 放 在 $42 中 讨论 ， 那里 将 引 
入 相应 的 变换 矩阵 ， 

显然 ,对 角 元 素 就 是 具有 相应 重 数 的 特征 信 。 事 实 上 ,着 这 些 
元 素 为 jt。 则 三 角形 矩阵 的 特征 多 项 式 即 为 I (mm 一 2)， 而 我 
们 已 知 ,特征 多 项 式 关 于 相似 变换 是 不 变 的 。 


Hermite 矩阵 与 对 称 矩 阵 
22 我 们 在 $ 31 中 将 看 到 , 实 对 称 矩阵 在 应 用 上 特别 重要 ,. 我 
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们 本 可 将 这 类 逢 阵 扩充 到 包括 所 有 复元 罕 的 对 称 符 阵 .但 是 ,这 样 
的 扩充 没有 多 大 党 义 ， 因 为 扩充 后 的 矩阵 类 不 具有 实 对 称 算 阵 的 
许多 极为 重要 的 特性 ， 最 有 用 的 扩充 是 包括 形 如 P 七 论 的 矩阵 
类 ,其 中 了 为 实 对 称 短 隆 ,2 为 实 反对 称 矩 阵 , 即 
9 一 一 0. {22.1) 
这 类 矩阵 称 为 Hermite 矩阵 、 若 4 是 Hermite 捧 阵 , 按 定义 
有 
4T 一 4， (22.2) 
中 4 表示 矩阵 ,其 元 素 为 4 元 素 的 复 共 轿 . 矩阵 47 通常 记 作 
各 ， 称 为 Hermite 转 置 矩阵 ， 类 做 地 ，za 是 行 向 量 ,其 分 量 等 
于 列 向 量 * 的 分 量 的 复 共 轿 ， 这 种 记号 很 方便 ,并 有 如 下 优点 , 即 
车 将 47 代替 4r，x7 代替 志 ， 则 对 Hermite 矩阵 证 明了 的 结 
果 便 可 变 成 实 对 称 和 矩阵 的 相应 结果 。 若 = 是 一 个 数 ， 则 sa 定义 
为 “的 共生 复 数 ,由 定义 立即 可 得 
《4 一 人 
(xH)H mx (22.3) 
(ABC)H = CHBHAN 
并 且 , 若 4 是 Hermite 矩阵 , 则 
AH = 4. (22.4) 
注意 ，?az 是 通常 意义 下 7 与 x 的 内 积 , 且 有 
Jaz 一 (Vr) 一 zay。 (22.5) 
内 积 zaz 对 一 切 非 零 向 量 * 均 为 正 实数 ,因为 他 等 于 z 各 分 量 的 
模 的 平方 和 。 


Hermite 矩阵 的 基本 性 质 


23. Hermite 矩阵 的 特征 值 都 是 实数 .事实 上 , 若 
Ar 一 jz， (23.1) 


则 
xz = lxHx, (23.2) 
我 们 曾经 指出 ,对 一 切 非 零 *，xsx 是 正 实数 ,其 次 ,我 们 有 
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《za4x)B 一 rH4axtE 一 wiHAx, (23.3) 
又 因 xa4x 是 一 个 数 ， 由 上 式 知 它 是 实 的 。 因此 4 是 实 的 。 对 
于 实 对 称 和 矩阵 ， 实 特征 值 意味 闭 特 征 向 量 也 是 实 的 。 但 是 , 复 
Hermite 矩阵 的 特征 向 量 一 般 说 来 是 复 的 ， 
着 ”4r 一 4x， 则 对 Hermite 矩阵 有 
AHx 一 jz， {23.4) 
两 边 取 复 共 轿 , 得 
4 一生。 《23.5) 
所 以 Hermite 矩阵 转 置 的 特征 向 最 即 为 原 和 矩阵 特征 向 量 的 复 共 
二 。 用 $3 的 记号 ,有 
WE (23.6) 

景 亲 *x; 在 理论 上 具有 重要 意义 。 对 于 Hermite 矩阵 ， 它 就 
变 成 zw。 根 据 $ 3 的 一 般 理 沦 立即 可 知 , 若 Hermite 矩阵 有 不 
同 的 特征 值 , 则 其 特征 向 量 满足 

zx 一 0 (7), (23.7) 
车 我 们 将 ws 规范 化 ,使 得 
zw 一 1， 《23.8) 
则 等 式 (23.7) 与 (23.8) 意味 着 ,由 特征 向 量 构成 的 矩阵 x 满足 
XHX 一 1。 即 X8 X71 (23.9) 
满足 等 式 (23.9) 的 矩阵 称 为 机 矩阵. 实 的 本 矩阵 称 为 正 交 虐 阵 . 

这 样 , 我 们 对 于 有 不 同 特征 值 的 Hermite 矩阵 和 实 对 称 矩 阵 
证 明了 下 列 结论 ， 

{了 D) 车 4 是 Hermite 矩阵 , 则 存在 丁 矩 阵 上 ,使 得 

UIAU 一 diag(17) ( 实 4%), 
(1) 车 4 是 实 对 称 矩 阵 , 则 存在 正 交 答 阵 ,使 得 
UIAU = diag(h) 《 实 1). 

Hermite 〈 实 对 称 ) 和 矩阵 的 最 重要 性 质 也 许 在 于 ， 我 们 刚才 仅 
对 不 同 特征 值 的 情况 证 明 的 性 质 (ID) (ID) 对 重 特征 值 的 情况 也 同 
样 成 立 。 证明 放 在 $ 47 中 讨论 . 

由 这 一 重要 结果 立即 可 得 ， 
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(D Hermite 矩阵 的 初等 因子 均 为 线性 ; 
(ii) 若 Hermite 矩阵 有 重 特 值 , 则 它 是 减 次 的 ; 
《ii) Hermite 矩阵 不 可 能 是 专 损 的 。 


复 对 称 矩 阵 


24. 实 对 称 和 矩阵 的 许多 重要 性 质 是 复 对 称 矩阵 所 不 具备 的 ,这 
一 点 可 从 下 面 的 矩阵 4 看 出 : 

4 -| 1 | (24.1) 
特征 方程 是 娄 一 2 站 一 1 一 0， 所 以 4 一 i 是 一 个 二 重 特征 值 。 
对 应 的 特征 向 量 的 分 量 ,满足 

Ia m0 itm 0, (24.2) 

所 以 只 有 一 个 特征 向 恒 , 其 分 量 为 1, 一 7). 
我 们 可 得 出 如 下 结论 ， 即 对 应 于 4 一 ; 的 是 一 个 二 次 因子 ， 
事实 上 ，Jordan 标准 型 是 


| 1}; 024.3) 


避让 ew 
用 西 变换 化 成 三 角 型 


25. 因为 Hermite 矩阵 总 可 以 用 本 相似 变换 化 为 对 角 型 ， 但 
饶 有 趣 昧 的 是 ， 用 这 种 变换 可 将 一 般 矩 阵 化 为 何 种 形式 。 可 以 证 
明 ， 任 一 第 阵 可 用 酝 相 似 变换 化 为 三 角 型 。 因 为 三 角 和 矩阵 的 特征 
值 立即 可 得 ,而 特征 向 量 也 比较 容易 求 出 ,并 且 因为 西 变换 具有 合 
乎 需要 的 数值 特性 ， 所 以 这 个 结果 有 重要 的 实际 意义 。 我 们 把 证 
明 帮 在 $ 和 中 讨论 ,那里 将 引入 相应 的 变换 和 矩阵， 


二 次 型 
26. 每 个 实 对 称 矩 阵 4 可 以 对 应 一 个 有 ?个 变量 zx, rz， 
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"的 次 


四 
rTAx — DD) aiirixy, (26.1) 


i 


其 中 < 是 向 量 ,其 分 量 为 w， 相 应 于 每 个 二 次 型 ,我 们 可 以 定义 一 
个 双 线 性 理 #74y 如 下 : 


。 
xTAy = DY aiitiyi — YT Ax 《26.2) 


所 
如 下 的 几 类 二 次 型 特别 有 塌 义 。 抵 阵 4 的 二 次 型 称 为 
正定 , 若 zrdz > 0 
负 定 ,车 xT4x <0， 
非 负 , 若 rdx 守 0， 对 切实 * 光 0 
非 正 ,车 xTAx 所 10， 
正定 二 次 型 的 矩阵 称 为 正定 矩阵 . 
x7Ax 为 正定 的 充 树 条 件 是 4 的 所 有 特征 值 都 是 正 的 。 事实 


上 ,我 们 知道 ,存在 一 个 正 交 矩阵 R， 使 得 


RIAR — diag(1), (26.3) 
因此 ,车 记 
r= Rs, 即 z= Rix, (26.4) 
则 有 
riAzr 一 5TRT4RYz 一 bp hg, (26.5) 


i=1 


而 立 如 对 一 切 非 零 的 z 都 是 正 的 当 且 仅 当 所 有 的 4， 都 是 正 


i=1 


的 由 (26.4) 可 知 ， 非 零 的 * 对 应 于 非 零 的 *， 反 之 亦 然 , 因此 
结论 成 立 。 因 为 矩阵 的 行列 式 等 于 特征 值 的 乘积 ， 所 以 正定 矩阵 
的 行列 式 必 为 正 。 
由 等 式 (26.4) 与 (26.5) 可 以 看 出 ， 求 正 交 矩 阵 R， 亦 即 4 
的 特征 向 量 的 问题 等 价 于 求 二 次 曲面 
ar 一 1 (26.6) 


tj 
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的 主轴 问题 ，1， 就 是 主轴 平方 的 倒数 . 重 特征 值 与 主轴 的 不 确 
定性 有 关 , 作 为 一 个 典型 例子 ,我 们 可 取 具 有 二 个 相等 主轴 的 三 维 
精 球 。 它 的 一 个 主 截面 是 圆 ， 我 们 可 以 取 此 圆 的 任意 两 个 互相 重 
直 的 直径 作为 主轴 。 


正定 性 的 充 要 条 件 


27. 念 rr4x 中 的 mr mt …， ze 等于零 ,由 此 得 出 的 二 
次 型 我 们 记 为 x74,z。 所 以 ，x4dra 是 了 个 变量 my zs -ae 
的 二 次 型 ， 这 个 二 次 型 矩阵 4, 就 是 4 的 + 阶 主导 主子 矩阵 ， 显 
然 ， 若 xr4dx 是 正定 的 , 则 zz 必 为 正定 。 事实 上 ,车 存在 一 
组 不 全 为 零 的 值 mn，'…。x。 使 得 xdrz 是 非 正 的 , 则 对 于 由 

#7 = (ms 1 0 ee 0) (27.1) 

所 确定 的 向 最 x74x 为 非 正 .因此 , 正定 敌阵 的 所 有 主导 主子 
式 一 定 是 正 的 。 
注意 ,用 完全 类 似 的 方法 可 以 证 明 , 正 定 矩阵 的 任 一 主子 矩阵 
都 是 正定 的 。 因 此 , 它 的 行列 式 是 正 的 ， 然 而 ,具有 # 个 正 的 主导 
子 式 也 是 正定 狂 的 一 个 充分 条 件 ， 我 们 用 归纳 法 证 明 如 下 : 

假定 对 (= ~- 1) 阶 抵 阵 此 结论 成 立 ,我 们 证 明 对 * 阶 矩阵 也 
成 立 。 如 若 不 然 ， 妈 假定 ” 阶 矩 阵 4 有 ”个 正 的 主导 主子 式 而 4 
不 是 正定 的 。 设 丸 是 正 交 托 阵 ,使 得 RTA4R 一 diag(2)， 记 x 一 
Rz。 寺 是 有 


xT4dx 一 2TRT4Rx 一 Bh, (27.2) 


根据 假定 4 不 是 正定 的 、 由 于 休 (%) 一 da(4) 之 0 所 以 必 


ji 
有 偶数 个 负 的 2。 设 前 " 个 是 负 的 , 今 考察 方程 组 

grt 二 gl (27.3) 
因为 i 是 x 的 线 狂 通 数 ,我们 得 到 ”个 变量 mm mm ,xx 的 
(n 一 r 十 1) 个 线性 齐 次 方程 。 它 至 少 有 一 个 非 零 解 *， 我 们 可 
以 将 它 记 为 《x4, ozts-is 0)。 相 应 的 = 也 是 非 零 向 最 ,可 记 
为 《zz 0, 0:…，0)， 对 于 这 全 x 与 xz， 我 们 有 
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xTAr = Biz? — Bhs? < 0, (27.4) 
1 5 


又 因 xz 一 0， 此 即 表示 ， 对 于 向 量 (za zz，x74n -zx 
是 负 的 ， 这 与 归纳 假定 相 矛 盾 ， 对 一 阶 和 矩阵 这 一 结果 显然 是 成 立 
的 ,所 以 对 任意 阶 矩 阵 成 立 。 

实 对 称 和 矩阵 对 应 一 个 二 次 型 ,同样 , Hermite 矩阵 可 以 对 应 一 
个 Hermite 型 


xHAx 一 orz 机 (27.5) 


bil 


我 们 有 

(xHAr)H 一 rHANxHH 一 xHAx, (27.6) 
因此 za4x 是 实 的 。 正 定性 等 概念 可 立即 推广 到 Hermire 型 ,并 
有 类 似 于 我 们 出 对 实 二 次 型 所 证 明 的 那些 结果 . 


党 系数 微分 方程 


28, 代数 特征 信 问 题 的 解 与 常 系数 线性 联 立 常 微分 方程 组 的 
解 有 密切 关系 。 # 个 未 知 通 数 六 ,为 ,…* ,ys 的 一 阶 齐 次 方程 组 
的 一 般 形式 可 写成 为 


BE(y) = Cy, G28.1) 
Ar 


其 中 * 是 自 变 量 , ?是 向 量 ,其 分 量 是 y, 而 B 与 C 都 是 ”X* 和 类 
降 . 落 刀 是 奇异 矩阵 , 则 左 端 的 个 方程 满足 一 种 线性 关系 . 右 端 
也 必须 满足 同样 的 关系 ,因此 为 不是 独立 的 . 所 以 此 方程 组 可 以 
降 阶 ， 我 们 不 讨论 这 种 情况 而 假定 B 是非 奇异 矩 降 , 

于 是 方程 (28.1) 可 写 为 


a 
Ey) = Ay, 8. 
瑟 (Cy) Y (28.2) 


其 中 
A4= BC. (28.3) 
我 们 设 (28.2) 有 形 如 
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一 ze 《28.4) 
的 解 ,其 中 x 是 不 依赖 于 : 的 向 量 ， 于 是 有 


hre! = Axet, 


所 以 

jz 一 4x。 (28.5) 
车 4 是 4 的 特征 人 入， 而 * 是 对 应 的 特征 向 量 , 则 等 式 (28.4) 给 出 
(28.2) 的 一 个 解 . 若 4 有 = 个 独立 的 特征 向 最 ,我 们 则 得 到 (〈28.27 
的 * 个 独立 的 解 ， 不 管 对 应 的 特征 值 是 否 不 同 均 是 如 此 . 可 是 ， 
(28.2) 应 有 * 个 独立 的 解 。 所 以 若 过 x， 亦 即 4 的 某 些 初等 基 
子 是 非 线 性 的 , 则 方程 (28.2) 必 有 一 些 非 纯 指 数 型 的 解 . 


对 应 于 非 线性 初等 因子 的 解 


29. 当 有 非 线性 初等 因子 时 。 解 的 性 质 可 用 Jordan 标准 型 
来 考察 , 设 X 是 将 4 化 为 Jordan 型 的 相似 变换 矩阵 , 落 我 们 引进 
新 变量 >， 令 


y= Xz, (29.1} 
则 (28.2) 变 或 
x 二 (8) 一 AXs, (29.2) 
亦 邑 
和 (0) = XAKs. 《29.3》 


注意， 方程 组 的 矩阵 经 过 了 一 次 相似 变换 ， 它 现在 是 4 的 Jordan 
标准 型 。 
例如 , 设 4 是 一 个 6 阶 矩 阵 , 它 的 下 Jordan 标准 型 是 
Ch) 
Ch) 


CA(h) | 
于 是 方程 (29.3) 是 
» 31. 


| 
a : | 
加 1 ! 

这 些 方程 中 的 第 一 ,第 四 ,第 六 个 的 解 是 
Be, se 一 acir 
其 中 ms es， wm 均 为 任意 常数 ， 第 二 个 方程 的 通 解 是 


2 一 Gaei 十 qteli’, 


ag, 


第 三 个 是 
ye 二 gatclt 十 L qtiel, 
2 
第 五 个 是 
2 dseu 二 ave, 
其 中 sm。， 2 都 是 任意 常数 。 所 议 方程 组 的 通 解 是 
a me 


2 一 gtci 十 ge! 


1 
一 天 Pei 十 qe 十 Ne 


3 一 Ce 
一 qe 十 05 
zo 


注意 ,这 里 只 有 三 个 独立 的 解 具有 纯 指 数 形式 ,它们 是 
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(29.4) 


(29.5) 


(29.6) 


(29.7) 


(29.8) 


set 


(29.9) 


go eleys PF dscltes, 2 — aschesy (29.10) 
这 正 是 我 们 所 期 望 的 , 因为 c，, cs, es 是 Jordan 标准 型 仅 有 的 特 
征 向 量 . 
将 * 代入 等 式 (29.1) 得 到 原 方程 组 的 通 解 . 车 将 XX 的 列 记 为 
mm zo 则 《28.2) 的 通 解 是 
4 1 4 
y= der (a 十 避 十 Fen) 十 mux 十 es) 


十 ge x + Ge 十 1z3) 十 aserixs 十 doe tise, 


(29.11) 
由 此 容易 看 出 一 般 情况 下 的 结果 。 


高 阶 微分 方程 
30. 现在 我 们 考虑 = 个” 阶 的 联 立 齐 次 微分 方程 


gr a 
I 《yo) 十 A (Cy) + et Aoys = 0, (30.1) 


其 中 dy 41，。…，4。 都 是 常数 的 (n Xn) 和 矩阵， 并 且 
det(4,) 天 03 而 加 表示 由 个 因 变量 组 成 的 维 向 量 ， (我 们 
用 加 代替 y, 其 理由 马上 便 会 清楚 .) 引进 a(r 一 1) 个 新 变量 


a 一 (0) 


A 


0 (30.2) 


y= 各 G9), 


可 以 将 方程 组 (30.1) 化 为 一 阶 方程 组 ， 
着 4 是 非 胡 异 的 ,我 们 可 将 (30.1) 写成 


Bey + Bo 十， 二 Bry = PAE (30.3) 
£ 


其 中 
B= —ArA,. (30.4) 
方程 (30.2) 与 (30.3) 可 以 看 作 是 ay 个 方程 的 单一 方程 组 ,共有 


3 。 


ar 个 变量 , 即 ps 为,…*, 和- 的 各 分 量 . 我 们 可 以 将 它 写成 形式 


9 10 0'…0 为 为 

0 入 为 

0 0 0 了 7 n=» |， 05) 
;i 日 a| : 

000 0… 多- 各- 

Bo B, B; B3 Br ys yr 


这 个 方程 组 可 用 上 节 方法 求解 , 这 就 需要 求 由 (30.5) 左 端的 
nr 阶 短 阵 8 的 Jordan 标准 型 。 虽然 这 个 短 阵 是 高 阶 的 ， 但 它 的 
形式 十 分 简单 ,并 且 有 大 量 零 元 素 , 设 4 是 8 的 特征 信 , * 是 特征 
向 量 ,将 * 划分 成 7 个 向 盟 zo, 4,……， x4， 于 是 


wr GG= 1 Oo 1), 


(30.6) 
Boxrot Bir 十 … 十 Bt = hres 
因此 
《Bu 十 Bt+ -et Bd) — Yao (30.7) 
det(Bot BA+ et Bi I7) 0 (30.8) 


则 方程 组 (30.7) 有 非 零 解 。 在 实际 工作 中 ， 我 们 可 选择 , 或 者 使 
用 rn 阶 矩 阵 刀 并 县 解 标准 的 特征 值 问题 ， 或 者 使 用 行列 式 方程 
《30.8)《 它 不 再 是 标准 的 , 但 其 中 的 矩阵 只 有 = 阶 )， 


特殊 形式 的 二 阶 方程 


31, 一 个 力学 系统 在 保守 力 系 作用 下 于 稳定 平衡 位 置 附 近 作 
微 振 动 的 运动 方程 具有 形式 
By = —Ay, (31.1) 
其 中 4 与 8 都 是 对 称 正定 矩阵 。 假定 解 的 形式 为 y 一 ze 只 ， 则 
应 有 


Bx 一 4x。 (31.2) 
记 忆 一 4， 上 式 化 为 

1Bx = Ax, (313) 
现在 我 们 证 明 , 若 4 与 是 对 称 的 ,并且 B 是 正定 的 , 则 det 4 一 
48) 一 0 的 根 都 是 实 的 。 


ed 


因为 好 是 正定 的 ,所 以 存在 正 交 和 矩阵 R， 使 得 


RIBR ~ diag(F), {31.4} 
其 中 及 是 38 的 特征 值 , 必 是 正 的 。 记 
diag(Bi) ~ D, diag( 有 1) 一 D?, 《31.5) 
我 们 有 
{A—1B) 一 RD(D-iRz4RD- — MDRT, (31.6) 
因此 


det(A — 4B) = (detR)(detD)’det(P— 4), (31.7) 
其 中 P= DRTARD-, (31.8) 
为 (detR 一 1, (detD》 一 了 8， 所 以 det(4 一 48B) 的 根 与 
det(P 一 41) 的 根 相 同 .后 者 就 是 对 称 矩 阵 了 的 特征 信 %, 4,…， 
za。 所 以 都 是 实 的 . 

矩阵 了 有 完全 的 特征 向 量 系 ww。 可 以 取 成 正 交 的 ,所 以 有 


Pei 一 hr, DRTARD™!s; ~ hisi, (31.9) 
由 此 得 出 
A{RD™!s1) = RD; 一 MRD(DRTRD™)s 
一 UB(RDTs)), (31.10) 


因此 。xi 一 RD-'si 是 “特征 向 量 "， 它 对 应 于 由 方程 (31.3) 所 表 
示 的 广义 特征 值 问题 中 的 1， 注 达 , 因 为 my 是 正 交 的 ,而 RD 
是 实 的 ,并 且 是 非 奇异 的 ,所 以 = 构成 方程 (31.3) 的 实 特 征 向 量 
的 完全 系 ， 其 次 ,我 们 有 

0 = sf; = (DRIr) TDRIx; 一 xT RDDRI™x = xf Br;, (31.11) 
这 表明 ,向 量 = 关于 B 是 正 交 的 . 

着 4 也 是 正定 矩阵 , 则 为 是正 的 事实 上 ,我 们 有 
4 一 HB 二 4 一 2 可 Bon GL12) 

而 好 4xi 与 可 Bm 都 是 正 的 。 


BS 一 一 和 Ay 的 显 式 解 


32. 现在 我 们 可 以 导出 方程 (31.1) 当 4 与 也 均 为 正定 矩阵 时 
的 显 式 解 。 设 za mm， zs 是 (31.3) 的 ”个 独立 解 , 对 应 于 特 
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征 值 和 as jh。 后 者 必 是 严 的 ,但 不 一 定 互 异 。 记 


hm (32.1) 
其 中 p; 取 正 值 ,方程 组 (31.1) 的 通 解 是 
y 一 人 (arerne + bie Tm) rs, {32.2) 


其 中 a 与 如 是 2 个 任意 常数 ， 假 定 解 是 实 的 ,我 们 可 以 将 它 
写成 形式 


y= 立 cicos( pt + Ei)xis (32.3) 
其 中 & 与 61 为 任意 常数 . 
形 如 ‘48 一 XDx 一 0 的 方程 
33. 在 理论 物理 中 ,我 们 刚才 所 考 虚 的 问题 常常 以 如 下 形式 出 
现 : 
(4AB — +1)x = 0, (33.1) 
此 处 4 与 B 都 是 对 称 的 并 且 其 中 之 一 (或 二 者 ) 是 正定 的 。 若 有 4 
是 正定 的 , 则 (33.1) 等 价 于 
(B 一 24-Dx 一 0 (33.2) 
因为 正定 乱 阵 的 行列 式 是 正 的 ,因而 是 非 奇异 的 。 若 B 是 正定 的 ， 
则 (33.1) 可 写成 


(4 — 14B-)(Bz) = 0. (33.3) 
正定 矩阵 的 逆 仍 是 下 的 ， 事 实 上 , 若 
4 一 Ridiag(of)R, (33.4) 
则 
4 一 Rrdiag(ar’)R, (33.5) 


因此 ,方程 (33.1) 与 方程 (31.3) 没有 本 质 的 差别 . 
不 应 低估 商 个 矩阵 之 一 是 正定 矩阵 的 重要 性 ， 若 4 与 妃 是 实 
对 称 矩 阵 , 但 二 者 都 不 是 正定 的 ; 则 4B 的 特征 值 不 一 定 是 实 的 ， 
这 也 适用 于 det(4 一 48) 一 0 的 根 ， 一 个 简单 的 例子 可 说 明 这 
一 点 。 设 
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4-| |， 3-| 小 (33.6} 


0 起 1 9 
则 
0 4 
4B=|[» ]. (33.7) 
48 的 特征 值 满足 方程 
Pb, (33.8) 
若 “与 5 的 符号 相反 ,出 特征 值 是 复 的 。 


若 4 与 了 都 不 是 正定 的 ， 设 (ec 十 部) 是 det(4 一 48) 一 0 
的 复 根 , 则 对 某 一 非 零 *， 我 们 有 


Ax = {w+ ip)Br. (33.9) 
因此 
xdx = {a + ip)xHBx, (33.10) 
因为 xa4x 与 xaBx 都 是 实 的 ,所 以 等 式 (33.10) 意味 着 
xHAr = #HBx = 0, (33.11) 
向 量 的 最 小 多 项 式 


34. 矩阵 的 特征 向 量 x 可 用 下 一 事实 来 刻画 , 即 在 x 与 4x 之 
闻 存 在 线性 关系 。 对 任 一 向 最 25， 则 没有 这 种 关系 存在 。 然而 。 
落 我 们 形成 序列 5。45, 43%，,"…,4'"%， 则 一 定 存在 7 的 一 个 最 
小 值 wm， 使 得 向 晤 5, 45， 4%5,…，A"5 线性 相关 ;显然 ，m 反 
#。 我 们 可 将 此 种 关系 写成 形式 
(Am + cn-idr 十 … 十 cp) 一 0. {34.1) 
根据 ;的 定义 ,不 存在 关系 式 
(A td A dD 0 (r <m), (34.2 
对 应 于 (34.1) 左 端的 规格 化 多 项 式 clX4) 称 为 向 量 5 x 了 的 
最 小 多 项 式 , 车 (4) 是 4 的 任 一 其 他 的 多 项 式 并 有 :(4)5 一 0， 
则 (4) 必 能 除 尽 (4) 事实 上 ， 如 车 不 然 , 则 根据 Eudid 算 
法 ,一 定 存在 多 项 式 p(4)，4(4),，r(4), 使 得 
bd4Js(4) — (A) AA) = +(4), (34.3) 
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其 中 rC4) 的 次 数 稀 于 <(4) 的 。 但 由 (34.3) 可 知 ，7(4)5 一 
0， 这 与 假定 (4) 是 使 得 此 关系 式 成 立 的 最 低 次 多 项 式 相 迎 
盾 。 

最 小 多 项 式 是 唯一 的 ,因为 若 有 第 二 个 着 次 的 规格 化 多 项 式 ， 
使 得 d(4)b 一 0, 则 fc(4) 一 4(4)]s m0, 而 且 c(4) 一 4(4) 
的 次 小 于 m。c(4) 的 次 数 称 为 5 关于 4 的 级 。 


逢 阵 的 最 小 多 项 式 

35. 用 类 似 的 方法 ,我 们 可 以 考察 矩阵 序列 1,4, 4?,…,4'。 
高 样 也 存在 ” 的 一 个 最 小 值 ;， 使 得 矩阵 1 4, 4?,…, 4 线 
性 相关 。 我们 可 净 此 种 关系 写成 形式 


本 十 cid 十 0 (35,1) 
例如 , 若 
hh po 
4 -[ 站 } (35.2) 
则 
4-| + po pipo ] (35.3) 
Ph pb 
因此 
2 [Pth pp] {TP Pb 
LPT Pl | 名 名 ] [， 9 ] 
加 0 0 0 
-| »]-[ 中 《354) 
因为 
4+al=| Pe |， (35.5) 
1 co 
且 此 式 对 任 一 co 内 不 等 于 零 , 所 以 不 存在 次 数 更 低 的 关系 式 . 这 
个 例子 在 后 面 几 节 里 是 很 重要 的 ， 


对 应 于 方程 (35.1) 左 端的 多 项 式 m (1) 称 为 托 降 和 的 最 小 多 
项 式 .与 $34 完全 一 样 ,我 们 可 以 证 明 它 是 唯一 的 ， 并 且 能 除 尽 
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任何 其 他 的 使 得 AL) 一 0 的 多 项 式 p(2)。 

任 一 向 量 5 关 于 4 的 最 小 多 项 式 c(4) 能 除 尽 m(4)， 因 为 
显然 有 m(4)b 一 0. 设 cx(24), ca) cal2) 是 cn ep 
e。 关于 4 的 最 小 多 项 式 ， 并 设 g(2) 是 cs(2) 的 最 小 公信 和 数 
(L. C. M.)， 则 有 

EC4)erm0 (G1, n), {35.6) 
因此 g(4) 一 0。 这 意 呈 车 对 任 一 向 量 g(4)5 一 0， 所 以 g(4) 
是 所 有 向 量 的 最 小 多 项 式 的 L，C，M,。 

事实 上 ,我 们 必 有 8(1) 一 ma(2。 因 为 根据 定义 m(4) 一 0， 
所 以 m(4)er = 0。 因 此，ci 的 最 小 多 项 式 的 L，C，M. 必 能 除 
尽 m(4)， 从 而 g(7) 能 除 尽 m(2)。 但 根据 定义 , m(X) 是 使 
m(4) 一 0 成 立 的 最 低 次 多 项 式 。 

我 们 从 列 向 量 组 5，46，420，… .出 发 发 展 了 这 套 理 论 . 类 似 
地 , 考察 行 向 量 组 扩 , 5674,574,……*， 我 们 可 以 确定 好 关于 4 
的 最 小 多 项 式 。 显然 ，b7 关于 4 的 最 小 多 项 式 就 是 5 关于 4 
的 最 小 多 项 式 . 

着 记 of, of，"…， 7 的 最 小 多 项 式 的 L. CM. 为 h)， 
出 我 们 可 像 上 面 一 样 证 明 儿 4》 是 零 第 阵 、 因 此 ，h(X) 也 异 等 
于 m(4)， 不 管 考察 行 向 量 还 是 列 向 量 ， 我 们 得 到 的 是 4 的 同一 
个 最 小 多 项 式 。 后 面 (5 37) 使 用 行 向 量 将 更 方便 。 


Cayley-Hamilton 定理 


36. 因为 4 的 每 个 短 次 中 有 内 个 元 素 , 所 以 4 的 最 小 多 项 式 
显然 不 能 大 于 后 次 的 。 现 在 我 们 证 明 , 若 4 的 特征 方程 为 
各 十 ce 十 0 (36.1) 


则 
da 十 cord 十 :十 co 一 0 (356,2) 
这 意味 着 矩阵 的 最 小 多 项 式 不 能 大 于 =” 次。 
为 了 证 明 这 一 点 ,我 们 引入 逢 降 4 的 伴随 乱 陈 B， 这 个 矩阵 
的 (i,7) 元 素 等 于 ow 的 代数 余 因 子 ， 亦 郧 在 det(4) 按 ; 行 的 
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展开 式 中 an 的 系数 。 所 以 我 们 有 
AB = det{A)1. {36,3) 

这 个 结果 对 于 任何 一 个 矩阵 都 成 立 ， 所 以 ,特别 对 矩阵 (21 一 4) 
也 成 立 。(21 一 4) 的 伴随 矩阵 B(2) 是 1 矩阵 ， 它 的 每 个 元 素 
是 (41 一 4) 的 (s 一 1) 阶 子 式 ， 所 以 是 2 的 多 项 式 ， 次 数 为 
# 一 1 或 更 低 ,我 们 可 写成 

B(1) = Bo tt Bahr ?+ .+ Bo (36.4) 
其 中 Bi 是 (sn X 4) 常数 矩阵 , 将 (36.3) 的 结业 应 用 于 (1 一 4)， 
得 到 

(1 ~ ABsd + + Bo) det — A)I 


一 《加 十 me i (36.5) 
这 个 关系 式 关于 4 是 恒 等 的 。 比 较 4 各 次 震 的 系数 ,得 
Bs 1 
B。 — ABss = cusl 
"1 Bs — ABss — caol (36.6) 
一 4 也 一 本 
将 这 些 方程 条 以 4,4"!，…, 1， 并 相 加 ,得 
0 一 4 十 cd 十 二 ce (36.7) 


所 以 ,每 个 方 阵 满足 自身 的 特征 方程 。 这 一 结果 就 是 熟知 的 
Cayley-Hamilton 定理 。 由 此 立即 可 知 ，、 最 小 多 项 式 能 除 尽 特 征 多 
项 式 . 因此 前 者 的 次 数 不 能 大 于 。 


最 小 多 项 式 与 标准 型 的 关系 


37. $ 34 的 讨论 有 时 可 用 来 导出 Frobenius 标准 型 《参见 To- 
rnbull 与 Aitken，1932)。 我 们 不 去 做 这 些 推 导 ,但 从 后 面 的 工作 
来 看 ， 了 解 矩 阵 的 最 小 多 项 式 与 其 Frobenius 标准 型 以 及 Jordan 
标准 型 之 疤 的 关系 是 重要 的 .。 

我 们 注意 到 ,所 有 相似 矩阵 具有 根 同 的 最 小 多 项 式 。 事实 上 ， 
车 H-'4H 一 B， 则 有 

HAH = H-:AHH-'AH = B', (37.1) 


类 似 地 ， 
H-'A'H = Br, 
由 此 得 出 
HANH = HB), (37.2) 

其 中 K4) 是 4 的 任 一 多 项 式 . 车 作 4) 一 0, 则 有 f(B) 一 0， 
反之 亦 然 。 因 此 , 4 的 最 小 多 项 式 能 除 尽 8 的 最 小 多 项 式 ,反之 亦 
然 。 所 以 这 两 个 多 项 式 必定 恒 等 . 

现在 考 洪 由 方程 (13.1) 所 给 出 的 * 阶 Frobenius 逢 阵 B,. 我 
们 碍 


euBr = ef (sm 1,2,.., 7 — 1), 


eTB, m= (bis bis **s Bo), (37.3) 
由 此 得 
eI(B)t er (R= 0, 1 7 — 1). (37.4) 
所 以 
eI (oaBt + ee ol) 一 (0 0, Cts G41s -+s 0) 
kr—l. (37.5) 


右 端 向 量 不 可 能 为 等 ， 除 非 所 有 wm 等 于 堆 。 所 以 e7 关于 8 
的 最 小 多 项 式 的 次 数 不 小 于 *。 事 实 上 ,我 们 有 

eTBr~ eT(b — .Bri+ baB i .+ I), (37.6) 
因此 e7 的 最 小 多 项 式 就 是 B, 的 特征 多 项 式 ， 所 以 B, 的 最 小 
多 项 式 也 就 是 它 的 特征 多 项 式 ，$ 35 的 例子 说 明 当 + 一 2 时 的 这 
种 情况 . 

我 们 转 到 一 般 的 Frobenius 标准 型 ,将 它 记 为 
B,, 


B=” a ， (37.7) 


其 中 每 个 Bu 的 特征 多 项 式 能 被 下 一 个 的 特征 多 项 式 除 尽 . 对 于 
8 的 任 一 多 项 式 8), 我 们 有 


As 


1(B,) 
KB) 一 2 . (37.8) 
1B,,) 


若 作 B) 是 零 矩 阵 ， 则 每 个 矩阵 忒 Bu ) 应 为 零 。 但 忒 Br) 是 零 
矩阵 当 且 仅 当 九 2) 是 Bu 的 特征 多 项 式 fi(%) 的 倍数 ,又 因 每 
个 (2) 能 除 尽 h(4)， 所 以 h(X) 是 了 的 最 小 多 项 式 。 因 以， 
fi(4) 是 与 召 相似 的 任 一 矩阵 的 最 小 多 项 式 . 

我 们 的 论证 表明 ， 当 且 仅 当 在 矩阵 的 Frobenius 标准 型 中 只 
有 一 个 Frobenius 矩阵 , 亦 即 挎 降 为 非 减 次 的 时 候 , 和 矩阵 的 最 小 多 
项 式 等 于 它 的 特征 多 项 式 。 和 将 别 当 特征 值 各 不 相同 时 ， 这 一 结论 
成 立 。 

38. 我 们 现在 转 到 Jordan 标准 型 ， 首先 考虑 初等 Jordan 条 
阵 ,例如 


«00 
CA(a)=|1 « 0|, (38.1) 
0 1 2 
为 了 简单 起 见 , 记 这 个 矩阵 为 5， 我 们 有 
0 0 a 0 0 
妇 一 | 2 有 0 1 已 一 | 和 和 0 (38.2) 
1 20 a 34 Sa a 


(为 了 确定 起 见 ,此 处 我 们 取 下 ”Jordan 标准 型 .) 显然 ，C? 不 是 
C 和 了 的 线性 组 合 , 因此 Cs(a) 的 最 小 多 项 式 的 次 数 大 于 2. 所 
以 最 小 多 项 式 就 是 特征 多 项 式 (a 一 2》， 今 设 C 是 Jordan 标准 
型 , 则 它 是 Jordan 子 矩阵 的 直 撑 和 ,我们 将 此 标准 型 中 的 一 般 子 
矩阵 记 为 “Ci(2)， 当 然 ， 对 特殊 的 为 值 , 可 能 有 若干 个 对 应 的 
于 矩阵 ， 像 Frobenius 型 一 样 , 我 们 看 到 , C 的 多 项 式 jC) 是 矩 
阵 下 Ci(%)] 的 直接 和 。 因 此 ， 当 且 仅 当 每 个 [Ci,(4;)] 为 堆 
时 ， 藉 C) 为 零 , 若 记 对 应 于 2 的 最 高 阶 Jordan 矩阵 为 CN(2)， 
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则 C 的 最 小 多 项 式 应 为 (2 一 4). 参照 $ 14 中 所 建立 的 for- 


den 标准 型 与 Frobenius 标准 型 之 间 的 关系 ， 可 以 证 明 我 们 已 经 
证 实 过 的 事实 相似 的 Jordan 标准 型 与 Frobenius 标准 型 具有 
相同 的 最 小 多 项 式 . 

需要 验证 的 是 , 一 个 向 量 状 与 每 个 为 的 最 高 阶 Jordan 子 抵 
阵 相对 应 的 位 置 上 的 元 素 等 于 1, 其 他 元 素 均 为 零 , 则 它 的 最 小 多 
项 式 就 是 Jordan 型 本 身 的 最 小 多 项 式 。 


定向 量 


39. 车 矩阵 4 的 初等 因子 均 为 线性 ， 则 它 有 # 个 特征 向 量 , 张 

成 整个 # 维 空间 但 是 假若 4 有 非 线性 因子 , 唱 这 一 结论 不 成 立 ， 

因为 这 时 独立 的 特征 向 量 少 于 * 个 。 然 而 ,较为 方便 的 是 ,有 一 组 

能 张 成 整个 * 维 空 间 的 向 量 ,并 有 选取 它们 ,使 得 当 4 的 初等 因子 

为 线性 时 即 化 为 ”个 特征 向 量 。 我 们 已 经 看 到 ,在 后 一 种 情况 下 ， 
可 以 取 使 得 

XAX = disg(hi) 《39.1) 

的 矩阵 X 的 列 作 为 特征 向 量 。 当 矩阵 有 非 线性 因子 时 ， 一 种 自然 

的 扩大 职 交 4 华为 Jordan 标准 型 的 矩阵 区 的 = 个 列 作 为 基 疝 


“这些 向 量 满 尼 -- 些 重要 的 关系 式 。 用 一 个 8 阶 矩阵 的 简单 例 
子 就 足以 说 明 这 一 点 。 假 设 和 矩阵 4 满足 
CD 
Ch) 
AX=X| cx » (39.2) 
C1) 
并 设 xm 和 是 X 的 列 , 令 两 端的 列 相等 ,我 们 有 
人 和 = ht Am = hr ts, Axs 一 lrst ri, Axs = hre, 
A 一 Urtry Axs 一 hxss Axy — haxry 
Axs = hxs, 
(39.3) 
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由 此 可 以 推出 
(4 一 az 一 0，(4 一 2 站]zz 一 0。(4 一 2 站 re 一 0。 
(4 一 27)aa 一 0 
(A—hI)t=0, (A—LT)xr=0, (A—hl)sy = 0, 
(4 一 47)m 一 0， 
所 以 ,每 个 向 量 x 满足 关系 式 
《4 — HI)irk ~ 0, (39.5) 
一 个 向 量 , 着 满足 方程 (39.5), 但 不 满足 《4 一 41) 的 次 数 
更 低 的 关系 式 , 称 为 对 应 于 的 i 级 主 向 量 。 注意 ，(2 一 0) 
是 xx 关于 4 的 最 小 多 项 式 . 任 一 特征 向 量 都 是 1 级 主 向 时 ， 矩 
阵 XX 的 列 都 是 4 的 主 向 量 。 因 为 X 的 列 是 独立 的 ， 所 以 存在 一 组 
能 张 成 整个 ” 维 空间 的 主 调 量 ， 一 般 说 来 , 主 向 量 不 是 唯一 的 , 因 
为 车 x 是 对 应 于 特征 值 必 的 ”级 主 向 量 ， 则 此 向量 加 上 任意 一 
个 对 应 于 同一 特征 值 但 级 数 不 大 于 ”的 主 向 量 的 倍数 , 仍 是 % 的 
r 级 主 向 量 ， 对 于 Jordan 标准 型 矩阵 ,向 量 ec， …，e。 是 一 
组 完全 的 主 向 量 系 ， 


(39.4) 


新 等 相似 变换 


40. 将 一 般 形 式 的 抵 阵 化 为 一 种 标准 型 或 任 一 种 压 编 型 ,通常 
可 用 一 系列 简单 的 相似 变换 来 逐步 实现 . 我 们 已 经 在 $ 17 中 讨论 
过 若干 初等 变换 矩阵 、 但 是 为 了 方便 ,我 们 要 将 它们 稍 加 推广 ,并 
对 每 一 种 类 型 引入 标 准 记号 ,在 本 书 的 其 余部 分 均 将 使 用 

我 们 称 基于 以 下 任 一 种 逢 阵 的 变换 为 初等 变 澳 ， 而 秆 阵 称 为 
初等 第 阵 ， 这 些 变换 矩阵 通常 有 如 下 形式 : 

(i) 矩阵 1a。 它 与 单位 矩阵 只 相差 第 ; 行 与 了 行 以 及 第 
列 与 1 列 ,这 些 行列 的 形式 为 


i 列 ij 列 
0 11i 行 
[ 1 0 ] i 和。 (40.1) 


特别 是 Jw 一 J， 显然 ，1115 一 了 ， 所 Js; 的 逆 即 为 自身; 它 也 
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是 正 交 的 、 左 莱 以 15 使 得 第 i 行 与 第 行 交换 ， 右 乘 时 使 得 第 
i 列 与 第 i 列 交换 。 因此， 用 拭 阵 jn 作 相似 变换 可 使 第 i 行 与 
第 j 行 交换 ,第 i 列 与 第 了 列 交 换 。 
(ii) 扼 阵 Pu wo。 定义 为 
pia 一 1， 其 余 的 pii 一 0， {40.2) 
此 处 (ms ww,……， ow) 是 (1, 2,…sn) 的 某 个 置换 。 这 种 矩阵 称 为 
置换 第 阵 ， 注 意 ,在 置换 矩阵 中 , 每 行 每 列 只 有 一 个 元 素 等 于 1, 
宣 换 矩阵 的 转 置 也 是 针 换 矩阵 ,并 有 
(CO A (40.3) 
任 一 置换 矩阵 可 以 才 为 1 型 矩阵 的 冬 积 ， 左 莱 以 了 使 原来 的 第 
a 行 变 为 新 的 第 i 行 ; 右 乘 以 PT 使 原来 的 第 mr 列 变 成 新 的 第 ; 
列 . 
(省 ) 和 矩阵 Ri， 它 与 单位 矩阵 只 相差 第 i 行 ,这 行 的 形式 为 
《一 rp 一 ra 一 rr {40.4) 
Ri 左 乘 4 的 结果 是 ,从 第 ; 行 减 去 其 他 各 行 乘 以 一 个 因子 。 第 
行 的 因子 等 于 rw。 另 一 方面 。 右 胰 的 结果 是 ,从 各 列 减 去 第 ; 列 
笨 以 一 个 因子 。 Ri 的 六 与 原 矩 阵 有 同一 形式 ， 只 是 其 中 每 个 元 
素 -ra 换 成 十 ri. 4 的 相似 变换 R-'4R 就 是 从 4 的 各 列 害 去 
第 列 莱 以 一 个 适当 的 因 于 ， 然 后 对 第 行 加 上 其 他 各 行 乘 以 同 
一 个 因子 .注意 ， 在 第 一 步 中 ,除了 第 i 列 外 ,我 们 改变 了 所 有 其 
它 的 列 ,在 第 二 步 中 ,我 们 只 改变 第 i 行 。 
(iv) 矩阵 51， 它 是 Ri 的 转 置 的 形式 , 将 5; 的 i 列 写 成 行 
测量 , 即 为 
(i fs 1 一 34nt 一 5r)]。【〔40.5) 
它 的 性 质 可 由 Ri 的 性 质 经 适当 改变 而 得 , 
(v) 矩阵 M4， 它 与 单位 矩阵 只 相差 在 第 : 行 上 ， 这 行 的 形 
式 为 


《0 0， 0 1s — tart 一 in), (40.6) 
所 以 Mi 是 一 个 已 ， 其 中 的 元 素 rn，,…， ri 均等 于 零 ， 
(Wi) 矩阵 Ni， 它 是 Mi 的 转 置 的 形式 。 将 其 第 i 列 写成 行 


45 。 


向 量 , 即 为 
(00 0, 一 ips + — Ha7). {40.74 
所 以 Ni 是 一 个 5;， 其 中 第 i 列 的 前 面部 分 元 素 为 零 . 
(WH) 矩阵 Mi 除了 (i, f) 元 素 为 -mw 外 , 它 等 于 单位 矩 
阵 ， 因 此 ，M;; 是 前 面 那 些 矩阵 的 特殊 形式 . 


初等 矩阵 的 性 质 


41. 读者 容易 验证 初等 矩阵 有 下 列 重要 性 质 . 

GD) 乘积 MaMa M， 是 对 角 元 素 为 1 的 上 三 角形 矩阵 。 
(i, 让 位置 上 的 元 素 当 j > 时 等 于 一 wa。 不 出 现 元 素 my 的 
乘积 . 

人 对 积 MM"…M。t 也 是 对 第 元 索 为 1 的 上 三 角形 抵 阵 ， 
但 是 moe 的 霖 积 出 现在 其 他 元 素 处 , 它 的 结构 比 别 的 乘积 的 结构 
更 复杂 . 

(者) 类似 地 ，NAN,.……NNs-， 与 NoiN。s*…*N， 二 者 均 为 对 
角 元 素 等 于 工 的 下 三 角形 甜 阵 。 前 者 的 《i, 力 位 置 上 的 元 案 当 
i > i 时 等 于 一 ni。 并 且 不 出 现 乘积 项 . 后 者 具有 类 似 于 
MaM…M。， 的 复杂 结构 ， 

(iv) 短 阵 


[ET rrtarPro tu] 


| 
(此 处 (+ 十 1) 守 7? 十 1, (+ 十 2)' 守 7 十 2,.…,(n 一 1) 关 
?3 一 1) 是 与 M- 同一 类 型 的 矩阵 , 它 的 第 了 行 ， 第 > 十 1， 
7 十 2，`……， = 列 的 元 素 是 M， 中 同一 位 置 上 元素 的 一 个 
置换 。 这 个 置换 是 一 系列 代 换 [Cr 十 1D) > 十 1[(r 十 2)， 
* 十 2] [一 1 2 一 1] 的 结果 ,类似 的 结果 对 和 矩阵 N。 
也 成 立 。 


用 初等 相似 变换 化 成 三 角 标 准 型 
42. 为 了 说 明 初等 相似 变换 的 用 处 ， 我 们 证 明 , 任 一 矩阵 可 用 
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相似 变换 化 为 三 角 型 ， 其 变换 矩阵 是 些 初 等 矩阵 的 乘积 。 我 们 用 
归纳 法 加 以 证 明 . 
假定 它 对 (s 一 1) 阶 矩 阵 成 立 。 设 4 是 = 阶 矩 阵 , 4 是 特征 
值 ， 对 应 于 4 至 少 有 一 个 特征 向 量 *， 即 
Ax = x. (42.1) 
对 任 一 非 奇 异 矩 阵 X，X4X-… 的 特征 向 量 是 X,。 我 们 指出 , 如 
何 选 取 XX， 使 得 X: 等 于 4. 记 
A (ty ts Ky hy ot Ks)s (42.2) 
此 处 第 + 个 元 素 是 * 的 第 一 个 非 零 元 素 ， 已 选 因 子 全 此 元 素 等 于 
1。 我 们 有 


(ie 一 《1 ps 为 yn) = (42.3) 
其 中 yi 就 是 按 菜 种 次 序 的 +1， 注意 ,+ 二 1 的 情形 包含 在 内 , 因 
为 Ls 二 1， 现在 着 对 y 左 秉 以 矩阵 Ni， 其 中 sa 一 加， 则 除了 
第 一 个 元 素 外 ,所 有 元 素 均 变 为 零 ， 因此 
Ny = Nlyx = oy (42.4) 
矩阵 Wiye47TuNir: 有 一 个 特征 值 1， 对 应 的 特征 向 量 为 “由 此 
可 见 , 它 必 有 形式 
T 
| 2 四 | (42.5) 
其 中 8 是 (2 一 1) 阶 方 阵 。 现在 根据 假定 ， 存 在 方 阵 HH, 它 是 
初等 阵 的 敢 积 ,使 得 


HBH-! = T, {42.6) 
其 中 工 为 三 外 型 。 因 此 


110]l[2+12]11iio LibH™ 
-------- ---1--- | = | -一 ----- 
oji8 lolaslloeer 0 HBH-! 


并 且 右 端的 托 阵 是 三 角 型 ,而 对 * 一 1 的 情形 结论 显然 是 成 立 的 ， 
所 以 , 它 对 一 般 情形 成 立 . 


(42.7) 


od. 


初等 酝 变 换 


43. 在 上 节 中 ,我 们 利用 初等 矩阵 将 一 个 一 般 的 非 零 向 量变 换 
成 ke.。 现 在 我 们 叙述 两 类 初等 巫 矩 阵 中 的 第 一 类 ， 它 也 能 用 来 
达到 同一 目的 . 
考虑 矩阵 R， 其 定义 为 
ri 一 emecos6， 7 一 casinB， 
ri = esin0, rj = ecos0, (43.1) 
rp = 1(p 克 i, 门 ,ree 一 0 对 其 余 的 ?与 4 
其 中 6, a, py ,8 都 是 实数 . 若 
co—7p~8+r (mod2rz), (43.2) 
划 此 矩阵 是 丁 答 阵 ,为 此 作 RFR 即 可 验证 . 
我 们 并 不 需要 关系 式 (43.2) 所 提供 的 充分 一 般 性 ,而 只 取 


yx— Pp, do——6, (43.3) 
由 此 得 
Ti 一 cos, ri esing, (43.4) 
ri —e sing, 万 一 eriecosb。 
这 类 特殊 的 矩阵 我 们 称 为 平面 旋转 。 显 然 ， 由 (43.4), 我 们 可 记 
二 (43.5) 


其 中 lc? 十 Ws 一 1 
Ra 本 身 也 是 一 个 平面 旋转 ,所 对 应 的 a 与 8 满足 
Smo, p+. (43,6) 
所 以 平面 旋转 的 逆 也 是 平面 旋转 . 当 a 二 8 一 0 时 , 短 阵 是 实 的 ， 
因而 是 正 交 和 矩阵 。 它 与 (i, 站 平面 上 旋转 一 个 角度 8 的 关系 是 
明显 的 ， 
44. 若 x 是 任 一 向 量 , 则 给 定 i, )， 我 们 可 以 选取 一 个 平面 旋 
转 , 使 得 (Rx); 是 实 的 并 且 是 非 负 的 , 而 (Rx) 等 于 零 ， 显 然 ， 
(Rz) = 对 一 切 :二 i, i， 我 们 有 
Rx) 一 2 十 cr。 (44.1) 
车 记 一 jx 十 |， 则 当 7 不 为 零 时 ,可 以 令 


48。 


后 让 
了 7 亚 五 ， < 一 全， (44,2) 


其 中 取 正 值 ， 显 然 ,此 时 (Rx); 一 0, 并且 
(Ra) ~ én + 3x = “十 J —r>0. (443) 


车 + 一 0， 则 可 令 “ 一 1，* 一 0， 若 我 们 不 需要 (Rz); 是 实 的 ， 
则 可 以 略 去 等 式 (43.1) 中 的 参数 se。 注意 , 若 = 实 的 , 则 等 式 
《44.2) 在 任何 情况 下 给 出 实 值 的 c. 
向 量 * 可 以 用 依次 左 乘 平面 (1, 2), (1, 3),…, (1, =) 中 的 
(2 一 1) 个 平面 旋转 而 变换 成 tc:。(1, i) 平面 中 的 旋转 选 得 使 
第 个 元 素 化 为 零 ， 从 以 上 证 明 可 知 ,可 以 选取 族 转 ,使 得 区 是 实 
的 并 且 是 非 负 的 。 显 然 
t= at a (44.4) 
电 此 立即 可 得 ,车 * 与 》 满足 (xx) 一 (yy)， 则 存在 旋转 矩阵 
的 乘积 5, 使 得 
Sx = y. (44.5) 
这 是 由 于 * 与 ? 二 者 均 可 用 平面 旋转 矩阵 的 乘积 变换 成 ke, ,而 
平面 旋转 的 逆 仍 为 平面 旋转 。 


初等 夯 Hermite 矩阵 


45. 第 二 类 初等 惠 矩 阵 就 是 矩阵 P， 其 定义 为 
已 一 了 一 2wwi, wiw = 1. (45.1) 
此 和 矩阵 是 本 矩阵 ,因为 
PPE = (1 ~ 2wwa)( — 2ww) 
于 了 一 4wtB 十 4w(wHw)wH 1, {45.2) 
它 显然 也 是 Hermite 短 降 。 这 美 短 隆 我 们 称 为 初等 Hermite 第 
阵 ， 当 ww 是 实 向 量 时 , 了 是 正 交 的 并 且 是 对 称 的 。 
车 ?与 zx 满足 关系 式 
2 一 Pz 一 zx 一 2o(owpy)y 《45.3) 
则 有 
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yy 一 zaPHPx 一 xHz, (45,4) 
以 及 
xHy 一 xHPx， (45.5) 
因为 P 是 Hermite 矩阵， 所 以 (45.5) 右 端 是 实 的 。 因 此 ,给 定 * 
与 y, 我们 不 能 期 望 可 以 找到 P, 使 得 》 一 Pr， 除非 zz 一 yy 
并 且 xray 是 实 的 。 现 在 我 们 证 明 ， 当 这 些 条 件 满足 时 , 我 们 的 确 
可 以 找到 合适 的 P. 
若 = 一 7 则 使 wsz 一 0 的 任 一 汪 就 给 出 所 需 的 P。 在 其 
他 情况 下 ,由 (45.3) 可 见 , 任 一 合适 的 ww 必 赣 在 一 * 的 方向 上 ， 
因此 我 们 只 要 考虑 由 下 式 给 出 的 
wo ey 一 xz ~ ry — x) 1, (45.6) 
显然 ,因子 e” 不 影响 所 对 应 的 P。 可 以 立即 证 明 , 任 一 个 这 样 的 
都 是 满足 要 求 的 。 事 实 上 ,我 们 有 
_ ms 一 -207 一 2 人 一 zx 
(一 2wtoHz 一 > Ca 《45.7) 
而 根据 假定 ，*z8y 是 实 的 , 且 xsz 一 yay， 所 以 
2(7y 一 xz]ax 一 2()8zx 一 xaxr) = yt 十 xzHy 一 xHx — yy 
=—(y— x)H(y— 7), (45.8) 


因此 
(一 2tumx 一 zx 十 (7 一 z) 一 包 (45.9) 
46. 一 般 而 言 , 左 乘 一 个 适当 的 P 不 可 能 将 * 变 成 ke:， 此 处 
入 是 实 的 可是。 若 记 x 的 分 量 为 "ne”%， 则 我 们 可 以 将 * 变 成 
如 下 的 和 


y mm 士 (zaxz)]eraeiy (46.1) 
因为 这 是 x3y 显然 是 实 的 ,作为 相应 的 P， 我 们 可 以 取 
w= (x— yr — (so IE (46.2} 


着 + 一 0, 则 9, 可 以 看 作 是 任意 的 ; 若 取 9, 一 0， 则 对 应 的 了 
将 * 变 为 “， 乘 以 一 个 实 因 子 。 我 们 感 兴趣 的 P 往 往 是 这 样 的 ， 
它 所 对 应 的 刀 的 前 * 个 分 量 为 零 ， 此 处 "是 0 到 ”一 工 中 的 其 个 
值 。 用 这 样 的 P 左 乘 向 量 x， 则 * 的 前 个 分 量 不 变 。 
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着 x 是 实 的 ,网 (46.1) 与 (46.2) 中 的 与 w 也 都 是 实 的 , 因 
此 P 是 实 的 。 注意, 利用 形 如 cp 的 本 着 阵 , 我 们 可 以 将 任 一 向 
量变 成 ke: 的 形式 ,其 中 不 是 实数 。 


用 初等 西 变换 化 成 三 角 型 


47. 现在 我 们 证 明 前 面 提 到 过 的 关于 用 正 交 ( 酉 ) 变 换 化 成 标 
准 型 的 两 个 结果 ($5 23, 25}。 我 们 首先 证 明 , 任 一 矩阵 可 以 用 西 
变换 化 为 三 角 型 。 我们 用 归纳 法 加 以 证 明 . 

假定 它 对 《2 一 1) 阶 撼 阵 成 立 . 设 4 是 s 阶 矩阵 , 4 与 + 是 
4 的 特征 信 与 特征 向 量 , 亦 即 


Ax — lx。 (47.1) 
由 $45 及 $46 可知 ,存在 两 矩 阵 忆 使 
Pr 一 her, (47.2) 


了 可 取 为 或 者 是 (n 一 1)》 个 平面 旋转 矩阵 的 乘积 ,或 者 是 一 个 初 
等 Hermite 阵 ， 由 (47.1)， 
PAx — Pax, PA(PHP)x = 1Px, 
(PAPH)Re 一 ic (PAPE)e = let 因为 0. (47.3) 
所 以 ,矩阵 P4 PV 必 有 如 下 形式 
1 六 
4 一 [| 《47.4) 
口 4- 
其 中 4。-: 是 (= 一 1) 阶 的 ， 现 在 根据 假定 ,存在 西 矩阵 R, 使 
得 


RAs :RE 一 了。 (47.5) 
其 中 To-: 为 三 角 型 ,因此 


i110 1i0 2 1 BTRE 
pr 49 | | | » (47.6) 
ol O JRE O 1 To 


1 0 
并 且 (47.6) 右 端的 矩阵 为 三 角 型 。 | T 是 西 矩 阵 , 于 


是 结论 成 立 。 注 意 ， 若 4 是 实 的 ,并 且 特征 值 是 实 的 , 则 其 特征 商 
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最 也 是 实 的 ,从 而 矩阵 是 正 交 的 ,全 部 变换 可 以 用 正 交 抵 隆 来 完 
成 . 
着 4 是 Hermite 托 降 , 则 三 角形 算 隆 是 对 角 型 。 事 实 上 ， 我 
们 已 知 ,在 在 西 拭 阵 妇 使 
Rd4R8 一 了 ， (47.7) 
其 中 并 是 三 角形 矩阵 ， 左 端的 矩阵 是 Hermite 矩阵 , 因此 了 也 是 
Hermite 抵 降 ,从 而 是 对 角 型 。 


正规 矩阵 


48. 我 们 刚才 已 经 证 明 , 对 任 一 Hermite 挎 阵 存在 西 矩 阵 R， 
使 得 
R4RL 一 了 (48.1) 
其 中 怠 为 实 对 角 和 矩阵 .现在 我 们 来 扩充 这 关 逢 阵 ,人 允许 DD 是 复 的 ， 
换 句 话说 ,我 们 车 虑 矩阵 4， 它 可 涯 为 形式 RSDR， 其 中 民 是 本 
逢 阵 , DD 是 对 第 和 矩 阵 . 车 


A = RIDR, (48.2) 
由 
44H = RHDRRHDHR 一 RA(CDD)R, {48.3) 
4a4 一 REDHRRHDR 一 RU( DHD)R. (48.4) 
因为 DD 好 然 等 于 D8D, 所 以 448 一 A484， 
反之 ,我 们 证 明 , 若 
AAN = AHA, (48.5) 


则 4 可 分 解 为 《48.2) 的 形式 . 事实 上 , 任 一 矩阵 4 可 以 表 为 形式 
RHTR， 其 中 尽 是 西 矩 阵 , 而 了 是 上 三 角形 矩阵 ， 内 此 
RHTRREITHR 一 RHTHRRHTR, 


电 此 得 
RaTTHR 一 RaTHTR, (48.6) 
上 式 左 续 以 R 并 右 乘 以 RI， 得 出 
了 THE 一 TAT. (48.7) 


比较 对 角 元 素 , 我 们 发 现 工 的 所 有 非 对 角 元 索 均 为 霉 , 所 以 并 是 对 
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角 护 隆 . 因 此 ,能 分 解 成 形式 RSDR 的 矩阵 类 与 使 得 4444 
的 矩阵 关 是 相同 的 。 这 种 矩阵 称 为 正规 矩阵 由 关系 式 (48.5) 显 
然 可 见 ,正规 矩阵 包括 下 列 矩 隆 ; 

人 iD 4 一 4《Hermite 矩阵 ) 

《ii) 4# 一 一 4 ( 反 Hermite 矩阵 )， 

(前 ) 4 一 4 ( 西 短 阵 )， 

在 实践 中 我 们 发 现 , 很 少 需要 求 反 Hermite 答 阵 或 西 撼 阵 的 
特征 值 。 


可 交换 矩阵 
49. 正规 矩阵 具有 4 与 48 可 交换 的 性 质 . 由 关系 式 
A = RHEDR， (49,1) 
我 们 有 
4RH 一 RHED， (49.2) 
类 似 地 
LHRH = RAED, (49.3) 


所 以 矩阵 4 与 48 有 公共 的 完全 特征 向 量 系 , 见 RE 的 列 。 

现在 我 们 证 明 ， 若 任意 其 个 矩阵 4 与 有 公共 的 完全 特征 向 
县 系 ， 则 48 一 84。 事 实 上 ， 若 将 此 特征 向 量 系 作 为 矩阵 五 的 
列 , 则 有 


A= HDH-!, B= HDH. (49.4) 
因此 ， 
AB = HDH HDH™ = HDDH™ (49.5) 
及 
BA = HDH HDH™' = HDDH™, (49.6) 


因为 对 角 矩 阵 是 可 以 交换 的 ,所 以 4B 一 B4， 


de A Pp hes 
并 用 它们 构成 矩阵 如 。 岗 
HAH ~ diag(hi), 《50.1) 


53。 


其 中 2 可 以 是 相同 的 ， 也 可 以 是 不 同 的 。 我 们 只 要 考虑 8 阶 虐 
阵 , 其 中 生 一 入 一 3， 和 一 Djk。 为, 是 单 重 的 , 就 可 明白 证 
明 的 实质 。 这 时 方程 (50.1) 可 写 为 

hb 


HB 一 | 一 (50.2) 


现 因 4 一， 我 们 有 
BAhi = UBhss (50.3) 
由 此 得 出 
A(Bhi) = 1( Bhi), (50.4) 
这 表明 ,车 如 是 4 的 对 应 于 4 的 特征 向 量 , 则 BH 落 在 对 应 于 
2 的 特征 向 量 的 子 空间 中 。 因 此 
Bh 一 Pub + pnhs 十 Puhss 
Bh 一 puhs + pub 十 phy, Bhs = pehs 
"Bhs = poshit Pahit pahs, Bh = pbs 《50.5) 
Bh ™ quhs + qhs, Bhs = pohs 
Bhs 一 quhs 十 qhs. 


这 些 方程 等 价 于 一 个 抱 阵 方程 


| (50.6) 


! 和 
现 因 8 的 初等 因子 是 线性 的 , 所 以 方程 (50.6) 右 端 矩 阵 的 初等 因 
子 也 是 线性 的 ,从 而 了 与 2 也 应 如 此 ， 因 此 ,存在 三 阶 盾 阵 K 与 二 
阶 矩 阵 上 ， 使 得 
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车 记 
gi | 
一 
G 一 | L | ， {50.8) 
Ts. 
则 
GH"!BHG 一 diag( £1). (50.9) 
另 一 方面 , 由 (50,2) 可 知 
GAHG = diag( bs). (50.10) 
因此 8B 与 4 有 公共 的 特征 向 量 系 , 即 HG 的 列 。 
4B 的 特征 值 


51. 注意 ,对 所 有 方 阵 4 与 8，48 与 B4 的 特征 值 是 根 同 
的 。 证 明 如 下 。 我 们 有 


pl! 4 
| (51.1) 
O eof 一 84 


Ii 
[各 一 和 (51.3) 
B | pf 
得 
prdet(X) 一 prdet(p 一 BA), (51.4) 
及 
prdet(X) 一 prdet( pl 一 AB). (51.5) 


方程 (51.4) 与 (51.5) 关于 pr 是 恒 等 的 。 记 yr 一 ?+， 我 们 有 
det(27 — BA) 一 det(17 — 4AB), (51.6) 
这 表明 4B 与 B4 有 相同 的 特征 值 . 
这 一 论证 还 表明 ， 若 4 是 mmX ”和 矩阵 ， 晶 是” Xw 短 阵 ， 则 
AB 与 B4 有 相同 的 特征 值 。 只 是 阶 数 较 高 的 那个 乘积 还 有 
lm 一 对 个 堆 特 征 值 . 


商量 与 矩阵 的 范 数 


52 用 一 个 数 来 全 面 衡量 一 个 向 旺 或 一 个 拭 降 的 大 小 ,这 是 很 
有 用 的 ,其 作用 相当 于 复数 的 模 。 为 此 目的 ,我 们 将 使 用 向 量 或 矩 
阵 元 素 的 某 些 函数 ,它们 称 之 为 范 数 ， 

向 最 范 数 将 用 jxl 表示 ， 我 们 所 使 用 的 范 数 均 满足 下 列 关系 


式 
(GD lzil>0 当 = 天 0% 且 ol 一 
(GD) x 一 1x1z， 对 任 一 复数 (52.1) 
(种 ) 类 十 验 志 和 十 yl 
由 (说 ) 得 
必 一 让 兰 Nzh 一 了 5 让. 


我 们 只 使 用 三 种 简单 的 向 量 范 数 ， 它们 的 定义 是 

人 zl 一 (aa 十 lal? + |x!) (p=1,2, 00), (52.2) 
其 中 lzl。 理解 为 maxlxy|， 范 数 |zj。 就 是 通常 意义 下 商量 x 
的 Budid 长 度 ， 我们 还 有 


sn = lB (52.3) 
以 及 
ly < Zl lyl < lb? (324) 
后 一 不 等 式 是 根据 Cuuchy 定理 得 到 的 ,所 以 我 们 可 以 记 为 
一 hlyleweog (0<0<F). (525) 


若 x 与 ?是 实 的 。 则 6 就 是 二 向 量 之 疗 的 夹 角 ;在 复 的 情形 ,我 们 
可 以 把 由 《52.5) 所 确定 的 8 作为 二 向 量 之 闻 的 广义 夹 角 。 
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类 似 地 ， 和 矩阵 4 的 范 数 将 用 上 4l| 表示 , 我 们 所 使 用 的 范 数 均 
满足 下 列 关系 式 

(0) 141>0 当 4*0, EN0N=0, 

Gi) 肽 4 一 |R 儿 4， 对 任 一 复数 大 

Ci) |4 + 引 < Ha + Bl, 

(Civ) 4B < 4Bl. 


(52.6) 


从 属 的 矩阵 范 数 

53. 对 应 于 任意 一 种 向 量 范 数 ,每 个 矩阵 4 可 以 联系 一 个 非 负 
的 量 supll4xH/llx4。 由 (52.1) 的 关系 式 《〈i 可 知 ， 它 等 价 于 
sup |‖|4xj。 这 个 量 显然 是 环 阵 4 的 函数 ,并 且 容 易 验证 ， 它 满足 


rll 


答 阵 范 数 所 带 的 条 件 ， 它 称 为 从 属于 该 向 量 范 数 的 矩阵 范 数 。 因 
为 


lA = supll Al lal, (53.1) 
所 以 对 一 切 非 零 *， 有 
14xls14 川 zh (53.2) 
上 式 对 * 一 0 显然 是 成 立 的 . 对 一 切 4 与 x,。 使 得 (53.2) 成 立 的 
矩阵 与 向 量 范 数 , 称 为 相 容 的 。 所 以 ,向 量 范 数 与 其 从 属 的 矩阵 范 
数 总 是 相 容 的 。 
根据 定义 , 对 任 一 种 从 属 范 数 ,我 们 有 | 中 一 1。 其次, 一 定 
存在 非 零 向 量 使 得 
14xl = 4 zl. 
根据 (52.1), 向 量 范 数 是 变 元 名 分 量 的 连续 函数 ,并 且 区 域 lz1l=1 
是 闭 的 。 因此， 我 们 可 用 maxll4zj/llzl 代替 sapll4zjAzxl、 
从 属于 lxlis 的 矩阵 范 数 用 | 4 路 表示 。 这 种 范 数 满足 关系 式 


14lh = mx 2 Yenl, 《53.3) 
4 = max 人 lorl， (53.4) 
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jj 一 (4a4 的 最 大 特征 值 ) 主 。 (53.5) 
前 两 个 结果 是 显然 的 ， 并 且 有 141, 一 4al-。 第 三 个 结果 证 明 
如 下 。 
矩阵 454 是 Hermite 矩阵 ,因为 xa4a4x 一 (4x)a(4z) 之 0， 
所 以 它 的 特征 值 都 是 非 负 的 ， 记 为 吕 ， 并 设 中 减 四 之 
吧 0。 根 据 定义 


NA ~ max As, (53.6) 
a8 lel 
pa du 
1 ~ max ls 一 max 4 (53.7) 


现在 设 ws ws,……s wa 是 484 的 正 交 特征 向 量 系 ,我 们 可 写 


tt™ Tam, {53.8) 
因此 
eAA# , Dloal'd < (53.9) 
TH Zod “ 


当 x ~ 时 达到 值 ol。 非 负 的 量 0 称 为 4 的 奇 辕 值 。2 范 数 
通常 称 为 谱 范 数 . 


Euclid 范 数 与 详 范 数 


54. 还 有 第 二 种 与 向 量 范 数 lxl。 相 容 的 重要 范 数 , 这 就 是 所 
谓 Eudid 范 数 或 Schur 范 数 ,用 14ll 表示 。 其 定义 为 


He= (Slap ). G54.0 
显然, 它 不 能 从 属于 任 一 种 向 量 范 数 ,因为 
1zje 一 寺 。 (54.2) 


Eudid 范 数 在 实用 上 是 一 种 十 分 有 用 的 范 数 ,因为 它 容 易 计 算 . 此 
外 ,根据 定义 ,我 们 有 


141s = 4lls, (54,3) 
矩阵 的 ! 范 数 与 co 范 数 也 有 类 似 的 关系 式 , 但 一 般 而 言 
4a tl ¥ iA. 《54.4) 
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事实 上 ,因为 14 性 等 于 4a4 的 迹 , 后 者 等 于 部 所 以 
lalh < Alls < a#14l, (54.5) 
上 式 两 端的 界限 是 可 以 达到 的 。 因 此 我 们 有 
N14 lb < la ll = lls < tal (54.6) 
Eudid 范 数 的 一 个 不 方便 之 处 在 于 
ladisgC) ls = (5 121), (54.7) 
liagCG)le = maxl hl Cp = 1,2,00). (54.8) 


甜 阵 的 Euclid 范 数 以 及 商量 的 2 范 数 与 矩阵 的 2 范 数 对 于 
丁 变 换 均 有 重要 的 不 变性 质 . 对 任 一 * 与 4 以 及 西 矩阵 R, 我 们 有 


| 及 xl 一 Ylls, (54.9) 
因为 
1Rz 作 一 (Rz)aRx 一 zaRnRz 一 xHxz = zB (54.10) 
类 似 地 ,根据 定义 直接 可 知 
HRA = 4, IRAR#b 一 4. (54.11) 
最 后 
HRAls 一 4lz， (54.12) 


这 是 由 于 RA 每 一 列 的 Eudid 长 度 等 于 4 的 相应 各 列 的 长 度 。 
现在 假定 4 一 RAdiag()R 是 一 正规 矩阵 ,于 是 有 
4Bls = |R"diag(t)RBls = lldiag( Xi) RB ls 
maxlhl|RBle 一 maxlhllBle. (54.13) 
今后 ， 凡 是 提 到 范 数 ， 均 指 我 们 已 经 讲 过 的 某 一 种 特殊 的 范 
数 ,我 们 将 不 把 范 数 的 概念 作 进一步 的 推广 。 然 而 ,即使 在 这 种 狭 
罕 的 定义 下 ， 对 范 数 加 以 统一 论述 也 是 有 利 的 ， 并 且 令 人 惊异 的 
是 ,由 于 它们 易于 使 用 而 获得 很 大 的 好 处 ， 


范 数 与 极限 


55, 建立 关于 矩阵 序列 收敛 性 的 一 些 简单 判别 准则 将 是 很 有 
用 的 。 当 结果 可 由 定义 立即 推出 时 ,我 们 略 去 证 明 . 
《4) fimA” 一 4 当 县 仅 当 I4" 一 4 一 0 
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车 40 一 4 则 Idol 一 4 
(者 141<b NM m4 0, 
事实 上 ， 
a 一 144 中 < 和 4 出 
<14PIA < < NA, 
(c) 着 1 是 4 的 特征 值 , 则 11 < jd 
事实 上 ， 对 某 个 非 宪 =*， 我 们 有 4x 一 4 因此, 鸡 任何 一 
对 相 容 的 矩阵 与 向 量 范 数 ， 
asl ~ hax = Maa < I4lls， 


[3 (55.1) 
由 此 得 
1 4 用 一 44 的 最 大 特征 值 
< 144 < ANA, = Al A, (55.2) 


《D) lim4" 一 0 当 且 充当 4 之 1 对 一 切 特征 值 成 立 。 这 


可 从 考察 Jordan 标准 型 而 得 ， 对 一 个 典型 的 Jordan 子 矩 阵 , 我 
们 有 
a 


ra a 


= . (55.3) 
rlr—l)rae 
2 ( ) 


1 a 


显然 , 当 且 仅 当 【| < 1 时 它 趋 于 零 . 通常 是 用 (D) 证 明 结 果 
{5), 可 是 ,因为 我 们 感 兴 直 的 只 是 相 容 的 盾 阵 与 向 量 范 数 , 所 以 


我 们 给 出 的 证 明 似乎 更 为 自然 , 量 
p(A) 一 maxlii (55.4) 
称 为 4 的 谱 半 径 ,我 们 得 
eA) AN. (55.5) 


《EE) 级 数 1 十 4 十 4 十.…" 当 且 仅 当 4 一 0 时 收 伊 ， 条 
件 的 充分 性 由 (DY) 可 得 ， 事 实 上 , 若 此 条 件 成 立 , 则 4 的 特征 值 
询 落 在 单位 贺 内 ， 


a 


因此 (1 一 4) 是 非 奇 晃 的 ， 关 系 式 
(一 4 人 (CT4 二 下 十 二 4) 一 工 一 4 (55.6) 
是 便 等 的 ,因此 
7 十 4 十 下 十 十 本 一 (一 4 一 (人 一 44 
《55.7) 
右 端 第 二 项 趋 于 零 , 所 以 
了 十 4 十 4 十 一 (一 4 
条 件 的 必要 性 不 证 自明 . 
《F) 级 数 工 + 4 十 4? 十 …- 政 伊 的 充分 条件 是 4 的 任 一 种 
范 数 小 于 1。 事 实 上 ,着 此 条 件 成 立 , 则 由 〔C) 可 知 ,对 一 切 特征 
值 ,有 


lui <1. 
因此 ,由 (D) 推 晶 4 一 0， 再 由 《E) 可 知 级 数 收 伍 。 
注意 ,存在 一 种 范 数 使 141 > 1 并 不 排除 级 数 的 收敛 性 . 例 


如 ,车 
-Loosl G5 


则 Il 一 1, 114 一 14.2, le 一 《1.54 半 然而 41 一 0, 因 
为 其 特征 值 是 0.9 与 0.8. 

当 在 实际 中 想 要 证 明 级 数 的 收敛 性 时 ， 我 们 可 以 任 取 一 种 最 
小 的 范 数 ， 

《G) (BE) 中 级 数 收敛 的 充分 条 件 是 4 的 人 儿 一 相似 变换 的 任 
一 种 范 数 小 于 1。 事 实 上 ,车 4 一 HBH7， 则 

1+A+:+tA HtB+.tB)H', (55.9) 
右 端 级 数 当 有 91 < 1 时 收 丝 。 

我 们 可 以 利用 相似 变换 得 到 一 个 矩阵 ， 使 它 的 某 一 种 标准 范 
数 小 于 原始 矩阵 的 范 数 。 对 于 〈F) 中 给 出 的 挎 阵 ,我 们 可 取 


s—[ "| -i 0 上 (55.10) 


0 工 0.1 0.8 
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这 时 有 13。 一 0.9. 
作为 一 个 更 有 说 服 力 的 例子 ,考察 


A= 


01 0 1.0 
0.2 0.3 0 | (55.11) 
0.2 0.1 0.4 

我 们 有 44 一 1.1, 4h 一 1.4, |4ls 一 (1.35)#. 定义 


十 0 0 2 0 1 0.1 0 0.5 
3 一 | 。 ‘ol | 
0 0 0 1 0.4 0.1 0.4 
《55.12) 
我 们 看 到 Bl 一 0.9， 所 以 关于 4 的 级 数 收敛 ， 用 对 角 矩 阵 作 
相似 变换 在 误差 分 析 中 往往 有 重要 意义 。 
避免 使 用 矩阵 无 穷 级 数 


56. 利用 范 数 的 基本 性 质 我 们 往往 可 以 避免 使 用 矩阵 的 无 穹 
级 数 。 例 如 , 若 14 上 < 1， 我们 可 用 如 下 办 法 得 到 上 (1 二 4 出 
的 界限 。 ， 

因为 上 41 < 1，4 的 所 有 特征 值 均 小 于 1， 所 以 《1 十 4) 
是 非 奇异 的 故 《; 十 4)-: 存在 ,我 们 有 

IT 一 (十 4) TI 二 4 一 (二 4) 十 (人 十 4 


(56.1) 
因此 
2 K+ 4) 1 — I FATA 
lt A oI + A474, (56.2) 
lI+ A eG maD= 0 — 4D 

车 ~ 1. (56.3) 

另 一 种 途径 是 , 写 出 
(T+ A 1 A+ A om. (56.4) 


此 级 数 当 14l < 1 收敛 ,由 (56.4) 得 到 
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让 人士 4 站 委 人 十 14 十 大 十 和 
一 (1 一 [MD 车 由 上 一 世 (56.5) 


附注 

本 章 中 ， 我 只 是 设法 给 出 本 书后 面 将 要 用 到 的 基本 材料 的 一 
个 概要 ， 此 领域 中 认真 的 研究 工作 者 需要 对 本 章 补 充 进 一 步 的 读 
物 。Gantmacher 的 《 矩阵 论 》 上 册 包 含有 对 经 上 典 理论 的 非常 完整 
的 叙述 。 我 已 经 在 文献 中 包括 了 此 领域 的 一 些 标准 教科 节 . Hou- 
seholder 的 《数值 分 析 中 的 矩阵 论 》(1964) 值得 特别 注意 , 因为 它 
除了 本 章 所 讨论 的 许多 内 容 之 外 ， 实 际 上 包含 了 后 面 各 章 将 要 讨 
论 的 所 有 理论 性 材料 。 
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第 二 章 摄 动 理论 
引言 


1 在 第 一 章 中 我 们 论述 了 代数 特征 值 问题 的 数学 基础 。 本 书 
其 余部 分 数 力 于 考察 在 计算 机 上 计算 特征 值 与 特征 向量 以 及 确定 
计算 出 来 的 特征 系 的 精确 度 时 所 产生 的 一 些 实际 问题 。 主 要 的 精 
力 将 集中 于 估计 在 问题 形成 及 其 解法 中 所 国有 的 各 种 误差 的 影 
响 。 这 里 有 三 个 主要 课题 

(i) 所 给 矩阵 的 元 素 可 能 是 由 物理 测量 直接 确定 的 ， 从 而 只 
有 一 贸 观 察 所 固有 的 误差 ， 这 时 ， 我 们 得 到 的 矩阵 4 是 粮 确 测量 
所 对 应 矩阵 的 一 种 近似 . 若 能 断定 4 的 每 个 元 素 的 误差 界限 为 5， 
则 我 们 可 以 说 ， 真 实 的 矩阵 是 〈4 十 E)， 其 中 E 是 某 个 短 阵 , 它 
满足 条 件 


lesl <#. (11) 
实际 疗 题 的 一 个 完全 解答 不 仅 在 于 确定 4 的 特征 值 ， 而 且 还 要 佑 
计 所 有 的 《4 十 请 ) 类 抵 阵 特征 信 的 变化 范围 ， 此 处 刀 满 足 条 件 
(1.1), 因此 我 们 必须 立即 考察 当 甜 阵 元 夫 摄 动 时 特征 信和 的 相应 摄 
动 . 
(i) 矩阵 苑 索 可 能 是 由 数学 公式 精确 给 定 的 ， 但 是 实际 上 仍 
有 可 能 无 法 在 计算 机 上 表示 这 个 精确 的 矩阵 ， 若 矩阵 的 元 素 是 无 
理 数 , 则 几乎 必然 如 此 .即使 它们 不 是 无 理 数 ,它们 的 精确 表示 可 
能 需要 比 可 供 我 们 使 用 的 更 多 的 位 数 ， 例 如 ， 秆 阵 4 可 能 是 若干 
个 矩阵 的 乘积 ， 而 每 个 矩阵 的 元 素 具 有 此 计算 机 通常 使 用 的 全 部 
位 数 ， 显 然 , 我 们 面临 着 几乎 与 〈i) 中 同样 的 问题 ,给 定 的 年 阵 
将 是 4 十 EE， 其 中 是 误差 矩阵 。 
《ii) 即使 我 们 可 以 将 计算 机 上 所 表示 的 托 阵 看 作 是 精确 的 ， 
但 计算 出 来 的 解 ， 一 般 而 言 将 是 不 正确 的 ， 最 常见 的 求解 过 程 含 
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有 康 和 矩阵 4 的 一 系列 相似 变换 和。 41，44,,.…… 的 计算 ， 而 执行 每 
一 个 变换 都 将 产生 会 人 误差 .初夏 起 来 ,由 这 些 变 换 所 产生 的 误差 
与 (i) 和 (ii) 中 讨论 过 的 误差 具有 不 同 的 性 质 ， 然而, 一 般 而 言 ， 
情况 并 非 如 此 ， 我 们 往往 可 以 证 明 ， 计 算出 来 的 矩阵 4， 精 确 地 
相似 于 矩阵 〈4 十 B)。 此 处 Es 的 元 素 都 很 小 。 它 们 是 舍 人 误 
差 的 函数 。 通 常 我 们 可 以 求 出 Ei 的 严格 界限 。 所 以 ，4 的 特 
征 值 恰 好 就 是 〈4 + Ei) 的 特征 值 ， 我 们 又 回 到 了 原来 的 问题 ， 
即 考察 当 和 矩阵 元 素 报 动 时 特征 值 的 相应 摄 动 。 


关于 特征 值 连续 性 的 Ostrowski 定 再 


2. Ostrowski 《1957) 给 出 了 特征 什 报 动 的 上 界 ,他 的 结果 可 
表述 如 下 . 
设 4 与 下 是 两 个 矩阵 ,其 元 索 满足 关系 式 
taal <1, loul < 1 (2.1) 
车 *#* 是 4 十 eB 的 特征 信 , 则 存在 4 的 特征 信 1， 使 得 
I 一 4<(n+ Da). (2.2) 
其 次 , 可 以 将 4 的 特征 值 1 与 (4 十 eB) 的 特征 值 % 作 一 一 对 
应 ,使 得 


[2 2 + De 六 (2.3) 
虽然 这 些 结 果 在 理论 上 很 重要 ， 但 它们 的 实用 价 信 不 大 。 假 
定 我 们 有 一 个 20 阶 矩 阵 4 ,元 素 是 无 理 数 并 满足 关系 式 
ci < 1 (2.4) 
现在 考察 矩阵 (4 十 E)， 它 是 由 4 的 元 素 经 第 10 位 小 数 点 的 合 
4 而 得 ,所 以 
leal < 10%, (2.5) 
式 中 的 上 界 是 可 以 达到 的 ， 根 据 Ostrowski 的 第 二 个 结果 得 
， 日 1 
[上 x (400 x 土 10* 六 (2.6) 
这 一 界限 比 用 简单 的 范 数 理论 能 够 得 出 的 界限 差 得 多 。 事实 上 ， 
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我 们 有 
1 < 14l, < 20, 


WWI el4+ Bh, <20+ 10 x 10-°, 7) 
此 

2 一 2 委 1 士 12 <40 十 10 (2.8) 

只 有 当 

2(a + 1 (me)? < 25, 
亦 即 当 
要 

GT 二 (29) 


时 ，Osrowsk 的 结果 才能 改进 用 简单 的 范 数 理论 所 得 的 结果 . 对 
z= 20， 这 意味 着 6 必须 小 于 10-?。 要 想 从 Ostrowski 结果 得 到 
一 个 有 用 的 界限 ,s 甚至 比 这 个 值 还 应 小 得 多 

显然, 因 于 时 是 Oorowsit 结果 的 主要 弱点 .不 过 ，Forsythe 


有 一 个 例子 表明 ,在 任何 一 般 竹 的 结果 中 ,这 个 因子 的 出 现 是 不 可 
避免 的 . 例如 ,考察 + 阶 Jordan 子 矩 阵 Cu(a)， 它 有 4 个 特征 什 


等 于 “， 若 我 们 将 〈1, 5) 元 素 从 0 变 到 s， 则 特征 方程 变 为 
《一 和 十 (一 De 一 0， (2.10) 
由 此 得 # 个 特征 值 为 
1 at oe tr 一 on 一 DT (2.10 
其 中 是 1 的 任 一 个 # 次 原 根 、 


代数 函数 


3. 后 面 的 分 析 需 要 代数 函数 理论 中 的 两 个 结果 (例如 参见 
Goursat，1933)。 我 们 叙述 它 ,但 是 不 加 证 明 。 
设 
Hz, 9) y+ perp) py 
ps) + polx), (3.1) 
其 中 p(x) 是 = 的 多 项 式 ， 对 任 一 * 值 ,方程 f(x, y) 一 0 有 和 
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个 根 六 (x), 为 (区 ,…*， ysx)， 每 个 根 出 现 的 次 数 等 于 它 的 重 
数 。 0, 7) 一 0 的 根 记 为 7.(0)，y(0),…*, ya《0)， 有 以 下 两 
个 定理 。 

定理 1 设 (0) 是 0,7) 一 0 的 单 根 . 则 存在 正 数 5;, 合 得 
Hz, =—0 有 一 个 单 根 

yo) = 0) + par + Pat +» (3.2) 

并 且 (3.2) 右 端的 级 数 当 【x1 < 8 时 收敛 。 

注意 : (i) 我 们 只 要 求 所 考察 的 yl0) 是 单 根 。 至 于 1 (0, 为 一 0 
其 他 各 根 的 性 质 不 作 任 何 假定 。 (ii) (3.2) 右 端的 级 数 可 以 为 有 
限 次 .着 ) 当 x* 一 0 时 (x) 一 (0). 

定理 2 车 六 (0) 一 00) 一 … 一 yn(0) 是 10, 7) 一 0 
的 = 重 根 ， 则 存在 正 数 a 使 得 fx, 四 一 0 侩 好 有 mm 严 个 零点 ， 
当 |z! < 时 它们 具有 以 下 性 质 : 

这 个 根 分 度 7 组 ,每 组 分 别 有 mmm。…，m, 个 机， 此 处 


Emi = mm, (3.3) 
ms 组 中 的 那些 根 为 级 数 
” 0 TF pas + pa + «ee {3.4) 
的 mm 个 值 ， 对 应 于 mr 个 不 加 的 = 值 ,而 
gm pm (3.5) 


注意 :，(i) 《3.4) 中 的 任 一 级 数 仍 然 可 以 为 有 限 次 .(ii) 有 可 
能 +1, 此 时 zt 一 m 并 且 所 有 "个 根 由 同一 个 分 数 次 知 级 数 给 
出 。(iii) 对 某 个 ;i， 有 可 能 mr 一 1， 此 时 (3.4) 中 相应 的 宪 级 
数 不 含 分 数 次 材 。(iv) 当 * 趋 于 零 时 ,所 有 mm 个 根 均 趋 于 7.(0)， 


数值 例 组 


4 (iD Hx, P14) Oo 3 + + (2 + x), 
我 们 有 
100, PD) = 3y+2, 
泵 此 ,例如 (0) 一 1 是 一 个 单 根 ,相应 的 根 (x) 为 
P(x) 一 [3(1 十 2) 一 (1 一 12r 十 142z2- 上 9 让/2(1 十 z。 
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显然 , 当 121z| 十 14 人 十 91z|' < 工时 ， 可 以 将 它 展 成 收 钴 的 
x 知 级 数 . 

CG) Fz, = Por + 

我 们 有 (00, 一 六 一 ， 所 以 y《(0) 一 1 是 单 很 而 
(0) 一 0 是 二 重 很 ， 显 然 

JaCx) 一 工 十 >， 

所 以 收敛 的 * 级 数 只 有 有 限 项 。 注 意 , 出现 二 重 根 并 未 导致 也.(x) 
中 有 分 数 次 宕 

相应 于 %(0) 一 0 的 禄 是 方程 

P+ yr+x(l+ x)—0 

的 解 , 即 为 


y= 至 [一 z 十 (一 4z — 30)4] 


一 去 [一 :+ 2 人 (1 + 三] 
的 二 个 值 , 因 此 宕 级 数 中 只 合 有 + 的 奇 次 军 ; 当 lz| < 土 时 ， 


此 级 数 收 敏 。 
Ci) 其 rz PD) or t+ x + (+) 
方程 f(0, 7) 一 0 有 四 重 很 y》 一 0。f(x,y) 一 0 的 很 为 
?一 zx 多 1 十 xz)t yt 
按 定理 2 的 记号 ,我 人 有 ml 一 2，ma 一 1， 一 1 
注意 ,虽然 第 三 个 多 项 式 有 一 个 四 重 零点 ,但 了 的 各 次 思 系 数 
的 摄 动 互相 有 关联 ,以 致 没有 一 个 根 的 摄 动 是 x 阶 的 。 这 种 类 型 
的 相关 报 动 在 特征 值 理论 中 是 常 有 的 。 


单 特征 值 的 摄 动 理论 


5. 现在 讨论 满足 关系 式 (2.1) 的 二 个 矩阵 4 与 B， 并 设 是 
4 的 单 特征 值 ,我 们 要 考查 (4 十 sB) 的 相应 特征 值 。 设 4 的 特 
征 方程 为 
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det(41—A) = he he ad 0 (5.1) 
姻 (4 + sB) 的 特征 方程 为 
det(11~A—5B) = 1+enale)a"™ 


十 esa(E) "+ +e) = 0, (5.2) 
其 中 cls) 是 6 的 (n 一 +) 次 多 项 式 ,并 且 
cr(0) = cr (5.3) 


如 果 我 们 考查 det(41 一 4 一 88) 的 显 式 表达 式 , 这 一 点 是 显 而 
易 见 的 ， 我 们 可 令 
cr(e) = ct cnet cn 二 十 crn-r8e (5.4) 
现在 因为 4 是 (5.1) 的 单 很 ,由 $ 3 定理 1 知 , 对 充分 小 sy 
(5.2) 有 一 个 单 根 ai(s)， 它 可 表 为 收敛 的 需 级 数 


Xs) + ke 二 be? (5.5) 
显然 , 当 s 一 0 时 4(g) 一 5 注意 、 
Ih(s) 一 2 一 0Ce) 《5.6) 
不 依赖 于 其 他 特征 值 的 重 数 。 
对 应 特征 向 量 的 摄 动 


6. 现在 转 到 特征 向 量 的 摄 动 。 我 们 首先 导出 对 应 于 4 的 单 特 
征 值 的 特征 向 量 xz, 的 分 量 的 显 式 表达 式 。 因为 la. 是 单 特 
征 值 ，(4 一 427) 某 少 有 一 个 非 零 的 《zn 一 D) 阶 子 式 。 不 失 
般 性 ,假定 它 位 于 《4 一 441) 的 前 (a 一 1) 行 ,于 是 很 据 线性 方 
程 组 更 沦 , x 的 分 量 可 取 为 

Aus Ams***, nn). (6.1) 
其 中 4: 表示 (4 一 21) 中 元 素 (w, i) 的 代数 余子 式 ,因此 它 
是 4 的 多 项 式 ,次 数 不 大 于 (x 一 1)， 

我 们 现在 将 这 一 结果 应 用 于 (4 十 8B) 的 单 特 征 值 4,(e). 
记 4 的 特征 向 量 为 +:，(4 十 58) 的 特征 向 量 为 x(s)。 显然 ， 
me) 的 元 素 是 Ll8) 与 8 的 多 项 式 , 又 因 Xls) 的 考级 数 对 所 
有 充分 小 e 均 为 收 合 ， 所 以 x,(s) 的 每 个 元 素 可 表 为 上 的 收敛 寡 
级 数 ,其 中 的 常数 项 就 是 x， 的 相应 元 素 , 我 们 可 令 


fa 一 入 十 8 和 十 的 2 十 (6.2) 
中 右 端 向 量 级 数 的 每 个 分 最 是 8 的 收敛 寡 级 数 。 类 似 于 (5.6) 
关于 特征 值 的 结果 ,我 们 得 到 关于 特征 向 县 的 结果 
Ials) 一 二 一 0(s)。 (6.3) 
这 里 还 是 没有 。 的 分 数 次 寡 。 


具有 线性 初等 因子 的 矩阵 


7. 若 和 矩阵 4 的 祈 等 因子 为 线性 、 则 可 假定 存在 完全 的 右 特征 
向 量 系 与 左 特征 向 量 系 ,分别 记 为 ru ms，ze 与 yp 为 
知 ， 并 有 


Wr = 0 CG ¥)), (7.1) 
虽然 只 有 当 所 有 特征 值 均 为 单 重 时 ,这 些 容 量 才 是 唯一 的 。 
将 (6.2) 中 每 个 向 量 x 用 xi 表示 ,如 


a 
a BD) si (7.2) 
j=1 


我 们 有 
xi(s) = by Siti + 时 立 2 十- (7.3) 


将 含 商量 x 的 各 项 合并 在 一 起 ,得 
zB) = (T+ su 十 s+) 
+ (gs Ent 
十 (sa 十 Bo 十 xm (7.4) 
上 式 括号 中 4 个 备 级 数 的 收 钙 钼 是 6.2) 中 级 数 的 绝对 收敛 性 的 
简单 推论 . 
因为 ma(s) 可 以 根 差 一 个 因子 ， 所 以 我 们 可 除 以 〈!1 十 eru 十 
ep 十 …)。 当 8 充分 小 时 ， 它 不 为 零 。 于 是 我 们 将 这 个 新 商量 
仍 记 为 (es)， 亦 即 
re) = rt (etn t Eta 
十 〔gta: El 二) (7.5) 
上 式 括号 中 的 表示 式 对 充分 小 5 仍 是 收 化 的 等 级 数 。 
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这 个 关系 式 是 在 z， 的 分 量 直接 用 行列 式 表示 的 假定 下 得 出 
的 .不 过 , 若 我 们 将 这 些 x 的 成 新 的 规范 化 的 4， 使 得 
lz = 1, (7.6) 
这 只 不 过 在 括号 中 的 每 个 表示 式 引 进 一 个 常数 因子 ， 可 将 它 吸 收 
到 各 中 去 .于 是 , 等 式 《7.5) 对 规范 化 的 x 成 立 , 昌 则 当 5 关 0 
时 xi(8) 不 见得 是 规范 化 的 。 


特征 值 的 一 阶 摄 动 


&. 现在 我 们 通过 =; 与 来 导出 一 阶 报 动 的 显 式 表达 式 . 首 
先 引进 量 5， 它 在 今后 的 分 析 中 将 反复 使 用 ,其 定义 为 
so Ws G12, 1), C8.1) 

其 中 % 与 = 是 规范 化 的 左 向 量 与 右 向 量 。 着 7 与 是 实 
的 , 则 4 就 是 这 二 个 向 量 之 间 的 夹 角 。 

着 有 重 特征 信 , 则 相应 的 ny 与 % 不 是 唯一 确定 的 。 这 时 假 
定 ,我 们 所 使 用 的 5 对 应 于 某 个 特殊 选取 的 xy 与 W。 基 亚当 关 
与 % 相应 于 单 特征 信 11 时 ,它们 还 可 以 相差 一 个 模 为 1 的 复数 
因子 ,但 在 这 种 情况 下 14| 是 完全 确定 的 


在 任何 情况 下 ,我 们 有 
lat = Wx & lsdbllasls = 1, (8.2) 
再 定义 量 Bii 为 
Bi YT Bris (8.3) 


因为 1BIh < *。 所 以 
lB8s] = IF (Bz2)| & Nyalll Bll < NB lolysdaleill, < "0 4 


9, 根据 定义 
(A + eB)x(e) = A(8)x(s), (9.1) 
因为 (8) 以 及 xi(e) 的 所 有 分 量 均 可 以 用 收 俩 的 震级 数 表 示 ， 
我 们 可 令 此 等 式 两 端的 同 次 宕 的 项 根 等 ， 令 上 的 项 相 等 ， 由 
(5.5) 与 (7.5) 得 
4 (2 nr) + Ba = (D tu) 二 kr (9.2) 
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或 者 


FY 0 ~ ry + Bx, = kare (9.3) 
上 式 去 委 好 并 记 住 并 ri 一 0 (i 天 1)， 得 
k= Bey = Bufss (9.4) 
因此 上 由 (8.4) 
LA (9.5) 


对 充分 小 的 &，74， 报 动 中 的 主 项 为 《s. 由 此 可 见 ,此 特征 值 
的 敏感 性 主要 依赖 于 。 可 异 的 是 ，5 可 以 为 任意 小 。 
特征 向 量 的 一 阶 摄 动 
10. (9.3) 去 乘 并 ， 得 
GQ — ht BD (i 2, 3 ), (10.1) 
因此 由 (7.5), x, 报 动 中 的 一 阶 项 为 
| Bx 十 Poem 十 .- 
Wh) 《一 2 


+ ee 元 ]. {10.2) 


注意 , 除 5 外 ,这 里 包含 所 有 的 5, 并 且 在 分 母 中 还 有 (4 一 1 。 
2 的 出 现 会 引起 一 些 误解 ,这 一 点 我 们 将 在 $ 26 加 以 说 明 , 不 过 ， 
我 们 可 以 预料 , 着 1 接近 于 和 任 一 其 他 的 特征 值 , 则 相应 于 单 特征 
值 4 的 特征 商量 对 4 的 摄 动 将 是 十 分 敏感 的 ,情况 的 确 如 此 。 

若 2 与 其 他 特征 值 相 隔 较 远 并 且 没 有 一 个 wG 一 2,…, 4) 
是 小 的 , 则 我 们 可 以 肯定 地 说 ,特征 向 最 ”~ 对 4 的 振动 是 比较 不 
敏感 的 


高 阶 振动 
11, 令 等 式 (9.1) 中 。 的 高 次 短 系 数 相等 , 我 们 可 以 得 到 高 阶 
摄 动 的 表达 式 . 例如 , 令 s’ 的 系数 相等 , 则 有 


4 全 tx ) +B F sr ) 一 昂 m 十 丰 
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x (家 cm)+a( 全 oo 


i 


成 者 
(和 一 2 十 下 (03 wa) 
一 bn 沾 久 (可 an) {11.1) 
左 绞 好。 得 人 
立 iapu = oss, (11.2) 
因此 由 (10.1) 人 
一 -pop Q113) 


5 ft sh CO— 
用 同样 的 方法 可 以 得 到 x， 摄 动 中 的 二 阶 项 等 ， 不 过 这 些 高 
价 项 的 实用 价值 不 大 。 


重 特 征 什 


12. 现在 转 到 * 重 特征 值 1, 的 摄 动 。 一 种 类 似 于 $5 的 分 析 
需要 利用 $ 3 的 定理 2。 它 表明 ， 对 应 于 这 样 一 个 特征 什 ,存在 江 
个 特征 值 ， 它 们 一 般 分 成 若干 组 ， 每 组 可 展开 成 。 的 分 数 次 筹 级 
数 ， 若 只 有 一 组 , 则 每 个 特征 值 可 表 为 时 的 敌 级 数 ;但 如 有 若干 
组 , 则 将 出 现 其 他 的 分 数 次 宕 。 有 时 我 们 可 能 有 普 组 ,在 此 种 情况 
下 , 不 出 现 分 数 次 宕 ,并 县 对 这 普 个 摄 动 特 征 值 中 的 每 一 个 2(e) 
成 立 关系 式 

12(e) 一 如 | = 0(e). (12.1) 

依据 特征 多 项 式 来 分 析 多 重 零点 是 很 粗糙 的 ， 因 为 它 与 原 矩 


阵 的 形态 相差 太 远 了 。 在 以 下 几 节 中 ,我 们 将 使 用 一 种 更 有 力 的 ， 
并 且 也 有 很 大 实用 价值 的 方法 来 重新 考虑 振动 理论 . 


Gerschgorin 定理 
13. 对 于 这 种 新 方法 我 们 需要 二 个 定理 , 它 应 归功 于 


AaB. 


Gerschgorin (1931). 
定理 短 阵 4 的 每 个 特征 信 至 少 位 平一 个 以 oi 为 中 心 , 半 


径 为 1 or 的 咒 盘 中 。 
证 明 很 简单 ， 设 1 是 4 的 任 一 特征 信 ， 则 至 少 必 有 有 一 个 非 夫 
向 最 *， 使 得 


4z 一 hz。 (13.1) 
假定 + 的 第 7 个 分 量 的 模 为 最 大 ,我 们 可 将 * 规范 化 为 
z= (rs Kgs toss Ls Xess Xn) (13.2) 
其 中 
lx [el 6 天门。 (13.3) 
令 (13.1) 两 端的 第 + 个 分 量 相 等 ,得 
bp rz = Mtr = (13.4) 


En 
因此 
Ral < Bans] < DB 1enllal 
fr Ir 


< Dlanl. (135) 
1 


所 以 , 位 于 上 述 的 一 个 加 盘 中 。 

第 二 定理 给 出 有 关 特 征 值 在 圆 盘 中 分 布 的 更 详细 的 信息 ， 

定理 4 若 定理 3 中 的 :个 回春 组 成 一 个 连通 域 ， 并 与 其 余 
回 盘 喇 开 。 则 在 此 连通 域 中 褒 好 有 * 个 4 的 特征 信 . 

证 朋 基 二 连续 性 概念 , 令 

A—diagla) t+ CoD+C, (13.6) 

其 中 是 一 矩阵 , 它 的 非 对 角 元 素 等 于 《的 相应 元 素 ,而 对 角 元 素 
为 零 , 量 定义 为 


wi laal, (13.7) 
加 
现在 考察 矩阵 (D 十 sC)， 其中。 满足 

0<e<s1l. (13.8) 


当 s 一 0 时 它 为 矩阵 D， 而 当 s 一 1 时 它 为 矩阵 4，(D + eC》 


14. 


的 特征 多 项 式 的 系数 是 6 的 多 项 式 ， 报 据 代数 函数 理论 ， 特 征 方 
程 的 根 是 的 连续 函数 。 按 定 理 3, 对 尾 一 s， 所 有 特 钙 值 均 位 
于 以 wz 为 中 心 , 半径 为 eri 的 圆 盘 中 。 著 令 s 从 0 连续 地 变 到 
1, 则 所 有 特征 信 均 连续 地 变化 . 

不 失 一 般 性 ,我 们 可 假定 前 * 个 贺 盘 组 成 连通 域 .由 于 以 ”ro 
rm vs rs 为 半径 的 《n 一 信 个 圆 盘 与 以 ro mm 六 为 
半径 的 右 盘 是 隔 开 的 ,因此 对 所 有 位 于 《13.8) 范围 中 的 6, 以 en 
为 半径 的 唤 盘 同样 也 有 此 性 质 .。 但 当 s 一 0 时 ， 特征 信 和 是 ea 
ao “9 4ans 它们 之 中 的 前 * 个 落 在 相应 于 前 “个 回 查 的 区 域 
中 ， 而 其 余 的 (s 一 9) 个 特征 信 落 在 此 区 域 之 外 ， 让 此 可 见 , 对 
所 有 的 6， 包括 8 一 1 在 内 ,这 一 结论 也 成 立 ， 

特别 地 , 若 某 个 Gerschgorin 圆 盘 是 孤立 的 ; 则 它 恰好 含有 一 
个 特征 信 ， 注意 ,用 47 代替 4 可 得 相应 结果 。 


基于 Gerschgorin 定理 的 摄 动 理论 


14. 现在 我 们 利用 jordan 标准 型 来 研究 (4 十 88) 的 特征 
值 ,分 为 五 种 主要 情形 . 
情形 1 ”具有 线性 初等 因子 托 阵 的 单 特征 值 2 的 法 动 。 
这 时 Jordan 标准 型 为 对 角 和 矩阵 ,存在 矩阵 互 使 得 
HAH = diag(%), (14.1) 
及 的 列 平行 于 完全 的 右 特征 向 量 系 xt, 而 有” 的 行 平行 于 完全 
的 左 特征 向 量 系 好 。 车 将 这 些 向 量规 范 化 为 
fxs = yl 一 1， (14.2) 
则 可 取 肥 的 i 列 作 为 mm， 并 按 $ 8 的 记号 ,可 取 H+! 的 i 行 作为 
闻 /5i, (注意 , 因为 4 是 单 特征 信 ，x, 与 如 除了 模 为 1 的 因子 
外 是 唯一 的 .) 根 据 互 的 形式 即 得 


Buls: Pol Biofs, 
H(A eB)H = dag(h) + [a Bula "Bods |. 


Boilss pre “Boalss 
(14.3) 


I5e 


应 用 定理 3 可 知 。 特 征 信 位 于 以 (% 十 spBii/5) 为 中 心 ; 半径 
为 8 己 lBsisi 的 罗盘 中 。 利用 关系 式 (8.4), 我 们 看 到 ， 若 
i 


Mal < 1， 则 第 i 个 加 盘 的 半径 小 于 a(n 一 1)ejlsl; 又 因 % 
假定 是 单 的 ,对 充分 小 。， 第 一 个 圆 盘 被 孤立 出 来 ,所 以 从 好 含有 
一 个 特征 值 。 - 

15, 我 们 刚才 得 到 的 结果 有 点 令 人 失望 ， 因 为 根据 以 前 的 分 
析 ， 我 们 原 可 预期 ， 相 应 于 的 特征 值 会 落 在 以 〈2 二 sBu/5》 
为 中 心 , 但 半径 为 D(e]) (s -> 0) 的 圆 盘 中 。 不 过 利用 下 面 简单 
的 办 法 ,我 们 可 以 缩小 Gerschgorin 贺 盘 的 半径 . 

若 将 任 一 矩阵 的 第 ; 列 飞 以 m， 第 i 行 乘 以 1/m, 则 其 特征 
值 不 变 。 将 此 结果 应 用 于 《14.3) 右 端 矩阵 的 第 一 行 与 第 一 列 , 即 
i 一 1， 并 到 mw 一 /gs， 于 是 它 变 为 

eBuls, epulks: spr/ksr "epinfks, 
diag(2) + | tpnfs spBalss spunfs, «eBanlsn 


pa/ss spoalss eps ap 


(15.1) 
现在 的 第 一 行 元 素 ,除了 (1.1) 外 ， 含 有 因子 e?; 而 第 一 列 元 素 ， 
除了 (1.1) 外 ， 与 无关, 所 有 其 他 元 素 不 变 。 我 们 设法 选取 
使 得 第 一 个 Gerschgorin 病 盘 尽 可 能 地 小 ， 同 时 保持 其 他 圆 盘 为 
充分 小 以 吕 免 与 第 一 个 相 重 挝 . 

显然 ,这 对 一 切 充分 小 。 均 成 立 ,只 要 我 们 取 丰 为 满足 不 等 式 


tpa/sl Ei ul G2 052) 


的 最 大 值 .关系 式 (15.2) 中 的 因子 证 没有 特殊 合 义 ; 它 可 用 任 


一 与 8 无 关 且 小 于 1 的 数 代 蔡 .) 若 取 
tmin|(h — bs/2pn) Cio2,.%,n), 《15.3) 

则 这 一 要 求 得 到 满足 .( 若 所 有 pr 均 为 零 , 则 4 十 spu/5: 就 是 一 

个 精确 特征 值 ,我 们 无 需 更 多 地 讨论 这 种 情况 .) 根 据 如 此 确定 的 名 
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我 们 得 到 第 一 个 Gerschgorin 圆 李 的 半径 为 
n= lagnal nn — etlal, 015.4) 


ET 


同时 有 
t= max|28af Ch — sl & max|2n/ Ch — M5), (15.5) 
我 们 在 此 提醒 读者 ,这 些 界限 是 在 假定 8 为 规范 化 、 即 12 < 1 
的 基础 上 得 到 的 。 

16. 界限 的 显 式 表达 式 往往 捧 盖 了 基本 技巧 的 简易 竹 . 当 我 们 
考察 数值 例题 时 ,这 种 简易 性 立即 变 得 十 分 明显 。 作为 说 明 , 我 们 


首先 考察 矩阵 X: 
0.9 0.1234 0.4132 一 0.2167 
X= 0.4 十 1075| 一 0.1342 0.4631 0.1276 上. 
0.4 0.1567 0.1432 0.3125 


{16.1) 
右 端 第 一 个 矩阵 有 一 个 二 重 特征 值 ,但 初等 因子 是 线性 的 。 
将 第 一 行 乘 以 10, 第 一 列 乘 以 10, 则 X 的 特征 值 等 于 下 列 


矩阵 的 特征 信 : 
0.9 1 
| “ih 
0.4 


10-5(0.1234) 10-8(0.4132) 10-2( 一 0.2167) 
| 10-!(0.4631) 10-’(0.1276) | (16.2) 
0.1567 10-5(0.1432) 10-5(0.3125) 
相应 的 Gerschgorin 圆 盘 为 : 
中 心 0.9 十 10“(0.1234) 
半径 10-8(0.4132 十 0.2167) 一 10-2(0.6299) 。 
中 心 0.4 十 10- 拒 0.4631) 
半径 0.1342 十 10-5(0.1276)， 
中 心 0.4 十 10-5(0.3125) 
半径 0.1567 十 10-5(0.1432)。 


IT 。 


第 一 个 加 前 显然 是 孤立 的 ,所 以 恰好 售 有 一 个 特征 值 .此 区 肯 中 的 
半径 为 0 量 级 。 其 余 二 个 对 角 元 案 为 相同 这 一 事实 全 然 不 影 
响 结 果 。 

可 是 , 藻 我 们 使 其 余 二 个 特征 值 之 一 趋 于 第 一 个 , 则 对 此 特征 
值 的 定位 将 产生 不 利 的 影响 ,考察 矩阵 Y， 


0.9 0.1234 0.4132 一 0.2167 
Y= 0.89 十 10-| 一 0.1342 0.4631 0.1276 |. 
0.4 0.1576 0.1432 0.3125 


{16.3} 
我 们 不 能 再 使 用 因子 10™ 了 , 因为 这 时 前 二 个 Gerschgorin 圆 盘 就 
会 重 选 。 使 用 因子 10…, 矩阵 变 为 


0.9 
0.89 
0.4 


10-(0.1234) 10-8(0.4132) 10-"(—0.2167) 
| 10-7(—0.1342) 103(0.4631) 10™(0.1276) | {16.4) 
10-2(0.1567) 10-(0.1432) 10"*(0.3125) 
第 一 个 加 盘 被 孤立 出 来 。 因此 有 一 个 特征 值 位 于 以 0.9 十 10 一 
《0.1234) 为 中 心 ,半径 为 89“(0.6299) 的 加 盘 中 . 
17. 情形 2 县 有 线性 初等 因子 矩阵 的 重 特征 值 4 的 报 动 ， 
对 这 种 情形 ， 只 要 考 察 一 个 6 阶 和 矩阵 ， 且 有 4 一 一， 
2 一 的 简单 例子 便 足 以 说 明 。 因 为 矩阵 4 的 初等 因子 为 线性 ， 


所 以 〈4 十 eB) 相似 于 


和 
的 Bufs Bo "Bls 
局 | Boja poja Bls | (171) 
本 1a Pols "Bal 


在 情形 1 中 我 们 已 经 讨论 了 ls ， 将 第 6 列 乘 以 t/s, 第 6 行情 以 


8 。 


8s/ 六 ， 我 们 可 以 界定 一 个 单 特征 信 ， 位 于 以 1 十 egajx 为 中 心 ， 
半径 为 0(e?) (s 一 0) 的 圆 盘 中 .现在 考察 其 余 五 个 Gerschgorin 
贺 盘 ， 有 三 个 的 中 心 为 4 十 sgajo (i 二 1,2, 3)， 有 二 个 的 中 
心 为 入 十 eBuls (i 一 4, 5)， 相 应 的 半径 均 为 8。 量 级 ， 显 然 , 对 
充分 小 。， 三 个 一 组 的 贺 盘 将 与 二 个 一 组 的 圆 盘 分 隔 开 来 但 我 
们 一 般 不 能 指望 一 组 中 的 个 别 风 盘 是 孤立 的 .三 重 特征 值 丸 的 报 
动 , 当 s 一 0 时 , 均 为 8 量 级 ,但 一 般 不 能 断定 ,以 入 十 eps/5s(i 一 
1，2，3) 为 中 心 ;半径 为 若 级 的 三 个 罗盘 中 每 个 合 有 一 特征 什 . 

18. 然而 ， 我 们 可 以 将 这 些 圆 盘 的 半径 编 小 一 些 ,我 们 把 注意 
力 集 中 于 三 重 特征 信 . 记 (17.1) 为 


P | 8 
diag(%h;) 十 | (18.1) 
Rs 


中 P,， 28,R，S 均 为 (3 X 3) 矩阵 ， 将 前 三 行 乘 以 /4 前 三 


列 冬 以 《1s， 得 
ep | kte’O 
diag(h) 十 本 -一 -一 一 | (18.2) 


我 们 可 以 选取 与 e 无 关 的 和 值 ， 使 得 前 三 个 贺 盘 与 其 余 的 分 隔 开 
来 . 因此 ， 对 某 些 适 当 的 《， 有 三 个 特征 值 位 于 下 列 三 个 圆 盘 的 
和 集 之 中 ; 
中 心 十 ep8uf5n， 半径 ell8a1 十 1917 十 
a [putt Ipsl + (pul)/élssl, 
中 心 ef8wj5s， 半径 s(184| 十 16s1)71a1 十 
ex(\Bnl+ Bas! + |Byel)/ Rls:l, 
中 心 和 十 s8s/s， 半径 (lB85l 十 18o1)71s1 十 
sx |pul+ lBsl 十 18s) ) /tiss|, 
对 于 一 个 6 阶 和 矩阵, 半径 的 这 种 缩小 并 不 给 人 以 深刻 的 印象 ,可 是 
对 高 阶 和 矩阵, 它 是 很 重要 的 。 我 们 在 后 面 (第 九 章 , $ 68) 将 看 到 ， 
把 (18.1) 的 矩阵 了 化 为 标准 型 可 以 得 到 更 精确 的 结果 , 但 我 们 不 
在 这 里 讨论 它 。 
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注意 ,我 们 已 经 证 明 , 当 4 有 重 特征 值 ,但 初等 因子 为 线性 时 ， 
特征 多 项 式 的 系数 必定 有 一 些 特殊 的 联系 ， 在 摄 动 中 不 出 现 e 的 
分 数 次 敌 。 

入 报到， | 

因为 4 有 某 些 非 线 性 初等 因子 ， 所 以 不 再 存在 完全 的 特征 向 
量 系 。 我们 首先 研究 对 这 种 和 矩阵 的 % 起 作用 的 那些 量 。 考察 简 
单 的 矩阵 

al 
4=|。 ,| (19.1) 
特征 值 是 4, 一 4 与 一 上， 相应 的 右 疝 量 与 左 向 量 是 
可 一 (1 0),0d = (1, 5 — a), 
oy — (a — 5, 1 = (0, 1), 
其 中 oe== [1 十 (a 一 于. 因此 有 

a= n= be, n= Hn (sb— e/a, (19.3) 
且 当 5 一 4 时 5 与 5 均 趋 于 零 . 我 们 已 经 知道 , 单 特征 信 对 
摄 动 的 敏感 性 与 7 成 比例 ， 因 此 ， 当 5 趋 于 = 时 ,两 个 特征 值 变 
得 愈 来 愈 敏感 .然而 ,我 们 注意 到 ,对 任意 的 5 值 ,有 十 地 ' 一 0， 
所 以 虽然 二 与 5! 均 趋 于 无 穷 大 ,但 它们 并 不 是 独立 的 ， 

20. 对 具有 非 线 性 初等 两 子 的 矩阵 , 可 以 利用 4 的 Jordan 标 
准 型 进行 类 似 于 前 面 几 节 的 分 析 。 存 在 非 奇异 矩阵 五 使 得 
H-'AH C， (20.1) 
中 C 是 上 Jordan 标准 型 ， 现在 我 们 不 能 随意 地 假定 互 的 各 列 
均 为 规范 化 的 ， 因 为 与 非 线 任 初等 因子 相关 的 那些 列 的 比例 因子 
受到 如 下 约束 ， 即 玩 求 5 中 的 上 对 角 线 元 素 为 1 (第 一 章 , $ 8). 
尽管 如 此 ， 假 定 与 线性 初等 因子 相关 的 那些 列 为 规范 化 仍 是 有 利 
的 ,我 们 用 G 表 示 由 H™! 的 规范 化 行 所 构成 的 矩阵 ,并 记 

一 车 8 与 加 相应 于 线性 因子 ; 

8 和 一 0 若 8 与 为 是 相应 于 非 线性 因子 的 部 分 向 量 系 . 

单 特征 值 的 摄 动用 一 个 简单 的 例子 便 足 以 说 明 ， 考 察 4 阶 答 


a 80 


(19.2) 


阵 , 具有 初等 因子 《4, 一 2，(% 一 ，(4 一 4) 我 们 可 令 


2 1 
H(A+ BH=| 0 由 ， 
2 
Bults puln | Bol Bults 


| 

Bufi Bul | Buf Bufn 

十 是 一 一 一 一 一 一 一 | (20.2) 
Buss Bulss | Bls, Bufss 


Bulss Buls, | Palss Puls 
其 中 
Bii = BT Bhi(— 人 ti, 1), |Bi| < (i,f > 3). (20.3) 
自然 要 问 , 单 特征 信 % 与 4 的 摄 动 是 否 为 
{1 —%| = 0(e), 
2) — | ~ 0(6), 
初 看 起 来 ，Jordsan 标准 型 中 有 元 素 1 好 像 是 很 不 利 ， 因 为 对 一 切 
s， 第 一 个 Gerschgorin 圆 盘 的 半径 大 于 1 从而， 若 人 4 一双 
小 于 1, 则 对 任意 的 s， 第 三 个 圆 盘 便 不 能 与 第 一 个 分 隔 开 .， 可 
是 ， 若 我 们 将 《20.2) 的 第 一 行 乘 以 m， 第 一 列 乘 以 1/m， 则 它 
变 为 


当 E 一 0, (20.4) 


4m Yu Yn Ya Yh 
0 4 +8 Ya Yn Yh Ys ， (20.5) 
as Ti To Ya Tw 
和 YY Tn 
中 zy 与 8 无 关 .选取 
[1 1 
mnie C20) 


便 可 排除 这 一 困难 。 为 了 孤立 第 三 个 Gerschgorin 圆 盘 并 使 它 的 
半径 为 外 量 级 ， 我 们 将 第 三 列 与 第 三 行 分 别 乘 只 kje 与 8/4， 
并 到 使 之 满足 
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tral < ls G3). {20.7) 


与 $15 完全 相同 ,我 们 看 到 , 对 充分 小 8， 以 为 十 eys 为 
中 心 , 半径 为 《|rs| 十 |ya| 十 17%1) 的 贺 盘 被 孤立 出 来 ， 所 
以 恰好 含有 一 个 特征 值 。 因 此 单 特 征 值 2 的 摄 动 为 

[2a(e) — hmersl = 0(s) Be 一 0， (20.8) 
这 里 的 ya 实际 上 就 是 Bs/5s。 由 (20.2) 得 151 二 4. 初等 因子 
(ua 一 4》 的 出 现 并 未 对 蜡 于 的 单 特征 值 的 性 质 产生 实质 性 
的 影响 。 读 者 容易 确信 ， 这 个 结 加 具有 营 伺 。 

21. 情形 4 相应 于 非 泪 次 矩阵 非 线性 因子 的 特征 什 的 报 动 。 

我 们 可 令 非 线 侍 府 子 为 tw 二 “由 为 信 定 着 库 症 非 成 次 
和 的 ， 所 以 不 再 有 (% 一 2) 震 次 的 其 他 因 于 .5 20 中 的 矩阵 可 用 
来 说 明 这 种 情形 . 我 们 考察 二 重 特征 值 4 一 % 的 摄 动 , 在 (20.2) 
中 ,元素 1 位 于 元 素 1: 所 在 的 二 行 之 一 ， 若 要 得 到 Gerschgorin 
车 盘 ， 其 半径 随 s 一 0 而 趋 于 零 , 则 必须 对 此 元 素 猴 以 某 个 因子 。 
事实 上 ,将 第 二 列 乘 以 时 ， 第 二 行 乘 以 -二 。 则 矩阵 和 变 为 


EN st ee sl se & 

0 A Ets 时 时 
4 十 a sie 日 小 QLD 

和 s 时 B & 


其 中 第 二 个 短 阵 的 每 个 元 素 省 略 了 一 个 常数 因子 ， 显然 ，Gersch- 

gorin 夯 盘 的 半径 其 主 项 为 ef。 对 充分 小 6, 有 两 个 特征 值 位 于 以 

2 为 中 心 ,半径 为 时 量 级 的 圆 盘 中 ， 类 似 地 ， 对 于 三 重 初等 因 

子 ， 将 第 二 与 第 三 列 乘 以 8# 与 呈 ， 第 二 与 第 三 行 乘 以 8 与 
es， 我 们 可 以 招 抵 阵 和 

41 1 0 8 

oi 1 8 

B 

e 


21.2 
0 0 % ) 


日 
8 
已 
加 5 


wm mn 


变换 成 
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4 Sto a 584 sie 

0 4 ef 二 时 sg bt 0213) 

0 0 入 esate el . 
hd 5 上 sf 

于 是 由 Gerschgorin 定理 可 知 , 对 充分 小 5s。 有 三 个 特征 值 位 于 以 

入 为 中 心 ,半径 与 时 成 比例 的 圆 盘 中 。 

对 ”# 阶 初等 因子 的 一 般 结果 现在 很 清楚 了 。 $2 给 出 的 例子 
表明 ,着 是 一 个 一 般 短 阵 ,我 们 不 能 避免 出 现 因 于 时 当然 ,也 
可 能 有 。 景 级 的 特殊 摄 动 ， 使 相应 的 特征 值 报 动 是 8 量 级 或 甚至 
为 零 ， 

22. 情形 5 当 有 一 个 以 上 (入 一 2) 等 次 的 初等 因子 且 至 少 
有 一 -个 为 非 线性 时 ， 特征 信 4 的 摄 动 . 

“在 对 此 种 情形 给 出 一 般 结果 之 前 。 我 们 考察 一 个 简单 的 矩 隆 
例子 , 它 的 Jordan 标准 型 为 

i 1 0 


《22.1) 


自然 要 问 ,是否 总 有 两 个 特征 值 位 于 以 4， 为 中 心 , 半径 为 0(s4) 
(se 一 0) 的 贺 盘 中 。 答案 显然 是 否定 的 ， 因为 ， 车 在 (3, 4) 与 
(5, 1) 位 置 上 给 以 摄 动 sp， 则 特征 方程 为 
(一 17 十 是 一 0 (22.2) 
从 而 所 有 的 摄 动 均 与 st 成 比 鲍 . 
然而 ,我 们 可 以 证 明 , 至 少 有 一 个 拉动 ， 它 的 县 级 不 大 于 si. 
事实 上 ， 我 们 考察 (22.1) 的 矩阵 元 素 中 所 有 可 能 的 量 级 摄 动 . 
我 们 可 以 将 特征 方程 按 《2 一 1) 宕 次 展开 ， 并 考察 展开 式 中 的 
行列 式 。 显 然 可 见 , 常 数 项 的 形式 为 
A 十 Ag’ 十 Ase! + Asss, (22.3) 
这 里 没有 项 或 者 与 8 无 关 的 项 ， 今 若 特征 方程 的 根 由 下 式 给 
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出 : 


(1— =p, (22.4) 
则 有 
立 i= A + As8’ 十 de + 4585 (22.5) 
tel 
因此 ， 不 可 能 所 有 p; 的 县 级 均 大 于 e3。 再 添加 上 蜡 于 2 的 任 
意 重 数 的 特征 值 显然 不 影响 此 结果 。 
相应 于 非 线性 因子 一 般 分 布 的 摄 动 


23. 阶 数 高 于 (% 一 4) 的 初等 因子 的 存在 使 得 对 应 于 线性 初 
等 因子 (% 一 2) 的 特征 值 的 敏感 性 受到 影响 ， 但 它 不 影响 异 于 
4 的 特征 值 ， 以 下 两 个 结果 作为 练习 留 给 读者 证 明 。 

设 相应 于 为 的 初等 因子 为 


(ho— AA, (ho A Ch Oo 21) (23.1) 
其 中 
i (23.2) 
则 对 充分 小 6， 报 动 pi, 如，………， P: 满足 
二 Pm Aet Amett + Ase'. (23.3) 


i=1 


因此 ， 至 少 有 一 个 4 位 于 为 为 中 心 ,半径 为 Kis” 的 咖 盘 中 ,其 
中 K, 为 某 个 数 . 另 一 方面 ,所 有 相应 的 报 动 特征 值 位 于 以 4 为 
中 心 ,半径 为 Ks 的 圆 盘 中 ,此 处 天 为 某 个 数 。 


根据 Jordan 标准 型 的 特征 向 量 的 摄 动 理论 


24. 考察 Jardan 标准 型 也 可 研究 特征 向 量 的 摄 动 . 我 们 不 打 
算 全 面 讨论 这 个 问题 ， 而 只 限于 4 的 初等 因子 是 线 华 的 悄 形 。 这 
时 有 


HAH = diag(4i), (24.1) 
五 的 列 构 成 4 的 完全 特征 向 量 系 rz ps zx 记 (4 + 8B) 
的 “相应 ”特征 向 量 为 xi(e), ze),."…, xn(5),，H™(A4 + eB)H 
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的 特征 向 量 为 si(s)，za(e)，…，zw(s)， 则 有 
zi(8) 一 Ht)。 《24.2) 
因为 x 是 完全 特征 向 量 系 , 所 以 存在 一 组 mw(e)， 使 得 
Hzi(g) = aoe)rit ole)xst --- tT aole)xs. (24.3) 
为 使 记号 简单 起 见 ,考察 $17 中 用 过 的 6 阶 矩 降 , 我 们 有 


hn 
hn 
H(A+eB)H~— ， 
和 
hn 
Bao Puls Bals -Bul 
+ el| Bulss Bals paja psjo |, (24.4) 


Boalss Bolfss als * Baalss 
现在 考察 单 特征 值 1。 我 们 看 到 zs(0) 一 co。 将 相应 的 zi(s) 
规范 化 ， 使 得 最 大 分 量 等 于 1, 对 充分 小 。， 它 必 为 第 6 分 量 。 事 
实 上 ,和 譬如 说 ,假定 它 为 第 4 分量, 则 令 关系 式 


Me)[za(e)] 一 hks) + Bsns) 0245) 
中 的 sue) 一 1, 得 
Me) ~ hh D2 pusis). (24.6) 


令 一 0, 左 端 趋 于 ls 一 和， 而 右 端 趋 于 零 。 队 而 引出 矛盾 . 因 
此 对 充分 小 6，szwl8) 一 1. 

现在 我 们 证 明 , 当 6 ->0 时 , 其 余 的 分 量 均 小 于 Ks。 此 处 K 
为 某 个 数 。 事实 上 :我们 有 


Mau(e) = hans) + BE Dy Paznle), (247) 
从 而 
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lal) 一 51ade < TT 2D leal. (24.8) 


因此 , 当 ds) 一 4 之 可 14 一 | 时 ,得 


28 5 po 


1za(e)1 < Tai 全 1 5), (249) 


知道 了 zn(s) (i 一 1,…, 5) 是 8 量 级 后 ,我 们 可 以 得 到 一 个 
政 先 的 界限 。 实 际 上 (24.7) 给 出 


{ss) 一 1%}aisls) 一 5 十 宇 ba Buxis(5), (24.10) 
全 Si f=1 


右 端 第 一 项 是 四 量 级 ， 所 以 


ep Nf er 
xie) my | 0(e’). (24.11) 


这 一 结果 本 质 上 与 《10.27 相沿 , 但 现在 我 们 可 以 看 出 如 何 去 获 得 
e 项 的 精确 界限 、 这 对 数值 例题 是 重要 的 ， 


相应 于 重 特征 依 ( 线 性 初等 因子 ) 的 特征 向 量 的 摄 动 


25. 对 相应 于 重 特征 值 的 特征 向 量 ， 我 们 不 可 能 证 明 这 么 多 。 
事实 上 , 若 ss(s) 是 与 有 (4+sB)B 的 特征 值 4s(s) 相应 的 
规范 化 特征 向 量 ,如 同 $ 24 一 样 ,我 们 可 以 证 明 ，zs(s) 的 最 大 分 
量 不 可 能 是 第 1, 2。 3,，6 元 素 ， 这 些 元 素 实际 上 为 量 级 . 因此 ， 
规范 化 的 ss(e) 应 取 下 列 二 种 形式 之 一 : 

[zis(8), ss(e), zis(5), KCe), 1, ze(s)] 《25.1) 


与 

Ea), #5(8), zss(8), 1, Ke)。ze(s)]， (25.2) 
其 中 |X(s)i < 1。 (4 十 6B) 的 相应 特征 向 量 xs(s) 在 名 x， 
为 ， 4 方向 上 的 分 量 为 量 级 ,但 在 由 x 与 x; 张 成 的 子 空间 中 
分 量 为 ;十 总 e)x 或 者 《ls)x, 十 zx、 因为 此 子 空间 中 的 任 一 
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向 量 都 是 4 的 特征 向 量 ,所 以 我 们 不 能 期 望 改进 这 个 结果 。 


报 动 理论 的 限度 


26. 尽管 我 们 在 $ 14 ~$ 25 中 所 发 展 的 摄 动 理论 有 很 大 的 实 
用 价值 但 在 此 阶段 指出 它 的 某 些 不 足 之 处 是 有 益 的 。 我 们 讨论 
了 当 s 一 0 时 摄 动 的 性 质 ,现在 考察 简单 矩阵 
0 ]. G26.1) 
0 a 
此 矩阵 有 非 线性 初 等 因子 〈e 一 2%)。 若 对 (26.1) 元 素 加 上 一 个 
振动 。， 则 圣 征 值 变 为 “十 (10-ae)8。 所 以 ,特征 值 对 的 导数 
当 e 一 0 时 和 趋 于 无 穷 大 。 然 而 ， 若 我 们 感 兴趣 的 摄 动 为 10-" 量 
级 ,这 一 点 是 可 以 避免 的 。 若 摄 动 矩阵 为 
[ 外 外 ] (26.2) 
63 8B4 
更 自然 的 是 将 此 问题 者 成 矩阵 
EE "| (26.3) 


0 a 


有 一 个 摄 动 

0 10°%® B81 63 

| 0 + “| C2544) 
而 矩阵 (26.3) 已 没有 非 线性 因子 。 

现在 转 到 特征 向 量 ， 我 们 已 将 它们 的 振动 分 解 为 ny zz， …。 

x。 方向 上 的 分 量 。 当 * 为 正 交 时 ， 这 种 分 解 是 很 有 用 的 。 但 车 
某 些 风 “ 几 乎 "线性 相关 ， 则 可 能 在 个 别 x; 方向 上 有 大 的 分 量 ， 
即使 摄 动向 最 本 身 很 小 。 我 们 在 $ 10 中 已 看 到 , 相应 于 单 特 征 值 
2 的 摄 动 为 


5 如 ay y+ Oe). (26.5) 


因此 , 一 般 可 以 期 望 , 若 5 很 小 , 则 x; 方向 的 分 量 将 会 很 大 ， 这 
可 能 会 引起 误解 ,从 以 下 矩阵 即 可 看 出 : 
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2 0 0 
0 1 1 。 (26.6) 
0 0 1+10°% 


a 1, =—10"/(1+ 10")#, 
n= 10-*/(1 + 10-7), (26.7) 
然而 ,相应 于 4 一 2 的 向 量 x 对 矩阵 的 振动 决 不 是 敏感 的 。 两 
个 向 量 为 与 *， 几乎 相 司 (% 与 六 也 是 一 样 )， 而 因子 pz/ 
{4 一) 与 pu/ss(% 一 9) 按 绝对 值 几乎 相等 ,但 符号 相反 . 因 
此 ，%w 与 方向 的 摄 动 几乎 相抵 销 . 


5 之 间 的 关系 
27. 在 以 上 例子 中 ，1/ss 与 1/s 两 者 都 很 大 , 但 按 绝 对 值 是 
相等 的 而 符号 相反 现在 我 们 证 明 ， 是 互相 依 贺 的 ， 以 至 不 可 
能 仅 有 一 个 1/s; 为 很 大 ， 若 设 
i271 
则 有 


oy rfrfr dy sf rfsss Pi = YF Ydy Te YF ylss, (27.2) 


yi = DY BurF Diy, = HD pa 
1=1 fa f=t 


容易 验证 


一 py (xf xz) CF)sT, (27.3) 
Tal 
由 此 得 
有 一 和 十 BD) (cosbicos pa)sT', (27.4) 
i 


其 中 95 为 xi 与 3 之 间 的 夹 角 ，i 为 3; 与 性 之 间 的 夹 和 角 。 
等 式 《27.4) 对 任 一 i 均 成 立 。 由 此 得 
1 1s) + 2 (eosbicos gi)s| 
Lald 
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<1+ DI. (27.5) 
EE 


这 表明 ,例如 对 一 个 3 阶 矩 阵 ,我 们 不 可 能 有 一 组 ;; 满足 
l= 10, ls = 10, | = 10, 
因为 
ll21+ i+ 1. 


计算 问题 的 条 性 


28. 若 楼 计算 的 值 对 数据 的 微小 变化 非常 敏感 ,我 们 称 此 计算 
同 题 为 坏 条 件 的 (通常 称 为 病态 的 )， 前 面 几 节 的 讨论 已 明白 地 显 
示 出 决定 矩阵 特征 系 敏感 性 的 将 多 因素 。 显然 一 个 矩阵 可 以 
有 某 些 特征 信 对 矩阵 元 素 的 微小 变化 很 级 感 ， 而 其 余 的 则 比较 不 
敏感 。 类 似 地 , 某 些 特征 向 景 可 以 是 好 条 件 的 (或 称 为 良 态 的 ), 而 
其 余 的 是 病态 的 ; 与 此 同时 ， 一 个 特征 向 量 可 以 是 病态 的 ， 而 对 
应 的 特征 信 则 并 非 如 此 。 

决定 抵 阵 对 特征 值 问题 的 解 是 否 为 病态 的 讨论 与 决定 它 对 计 
算 递 逢 阵 的 条 件 的 讨论 是 不 同 的 。 我 们 在 第 四 章 $ 11 将 看 到 , 一 
个 规范 舌 阵 着 有 很 小 的 特征 信 ， 则 对 求 逆 逢 阵 无 疑 应 看 作为 病态 
的 ， 但 这 对 特征 值 问题 的 条 件 并 不 彬 于， 适当 选取 t， 我 们 可 以 
使 得 (4 一 妇 ) 恰好 为 奇异 的 ， 但 是 《4 一 女 ) 的 特征 系 的 敏 
感性 与 4 的 是 一 样 的 。 然 而 ,我 们 将 证 明 , 在 这 两 类 计算 同 题 的 条 
件 之 间 有 某 种 联系 。 


条 件数 
29. 有 某 个 数 能 确定 矩阵 关于 计算 问题 的 条 件 ， 这 是 很 方便 
的 ， 此 数 称 为 “条 件数 ”, 理 论 上 它 应 给 出 当 系数 变化 时 , 解 的 变化 


速度 的 某 种 "总 体 性 估计 ”， 从 瑟 它 应 当 在 某 种 程度 上 与 这 一 谈 化 
速度 成 比例 。 


从 $ 28 所 述 显 然 可 知 ， 即 使 我 们 仅 限于 特征 值 的 计算 问题 
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这 种 单一 的 条 件数 也 将 会 有 严重 的 局 限 性 . 若 某 个 特征 值 很 敏感 ， 
即使 其 余 特 征 值 很 不 敏感 ， 则 条 件数 理应 很 大 。 不 管 它 的 明显 的 
局 限 性 ,单一 条 件数 已 被 广泛 应 用 于 初等 因子 是 线性 的 矩阵 。 


抵 阵 4 关于 特征 值 问题 的 谱 条 件数 


30. 设 4 的 初等 因子 是 线性 的 , 鼠 是 一 矩阵 , 它 使 得 
HAH = diag(%). (30.1) 
若 * 为 (4 十 eB) 的 特征 信 ， 则 矩阵 (4 十 68 一 4) 是 奇异 
的 ,因而 其 行列 式 为 零 ,于 是 有 
HAEB—HU)H= dag(l—1) + eH"BH. (30.2) 
两 端 取 行列 式 可 见 , (30.2) 右 端 矩阵 也 必定 是 奇异 的 。 我 们 分 别 
讨论 两 种 情形 。 
情形 1 4 一 4， 对 基 个 与 
情形 2 4 %， 对 所 有 i。 因 此 可 写 为 
diag(hi — +) 十 sH-!BH 
=—diag(hi—A)[1 + ediag(hi — 41)" HBHI], (30.3) 
再 取 行 列 式 ,我 们 可 以 看 出 , 方 括号 中 的 矩阵 必定 是 奇异 的 。 因为 
假若 jzll < 1,， 则 (1 十 X) 的 特征 值 都 不 可 能 是 零 . 因此 ， 特 
别 有 


jadiag(2 一 #) HBH > 1, (30.4) 
由 此 得 到 
部 emax| Ch 一 WT NB lH 1， (30.5) 
minlb 一 对 < el lal Bil. (30.6) 
因此 在 两 种 铺 形 下 都 有 
1 一 21 < ex (4)BIs， 至 少 对 一 个 i (30.7) 
其 中 
AH) 一 1。 (30.8) 


由 于 它 依 赖 于 谱 范 数 ，*(4) 通常 称 为 谱 条 件数 (参见 第 四 章 
5 3)。 我 们 证 明了 4 的 特征 信 的 总 体 敏 感 狂 依 右 子 <(4) 的 大 
小 , 所 以 4) 可 以 看 作为 4 关于 特征 值 问题 的 条 件数 刚才 我 


90 。 


们 证 明 的 结果 属于 Bauer 与 Fike(1960)。 
注意 , (30.6) 对 任 一 种 使 得 
Jiag( 一 HT me max|7 一 4 一 (30.9) 
的 范 数 都 成 立 , 所 以 对 1 范 数 与 co 范 数 成 立 ， 因 为 它 对 2 范 数 
成 立 ,对 Eudid 范 数 更 加 成 立 。 
应 用 连续 性 概念 ， 如 同 证 明 Gerschgorin 第 二 定理 那样 的 方 
法 ,我 们 可 以 更 精确 地 界定 根 。 由 此 得 出 以 下 结果 : 车 :个 贺 盘 
I — 2 < er (HB (30.10) 
构成 连通 域 ， 并 与 其 余 的 隔离 , 则 恰 有 * 个 特征 值 位 于 此 区 域 中 ， 


谱 条 件数 的 性 质 


31. 因为 矩阵 吾 不 是 唯一 的 (即使 特征 值 不 相 岗 ， 每 列 还 可 以 
乘 上 任意 因子), 我 们 定义 4 关于 特征 值 问 题 的 谱 条 件数 为 ;在 所 
有 可 取 的 五 中 eF) 的 最 小 值 ,在 任何 情况 下 我 们 有 
«(HF) = HAHIb > 皮下 一 1, {31.1) 
若 4 是 正规 矩阵 《第 一 章 $ 48)， 特别 是 若 它 为 Hermite 矩阵 或 
西 矩 阵 , 我 们 可 取 妇 为 西 算 阵 ,于 是 
xs(H) = 1. (31.2) 
因此 ,正规 矩阵 的 特征 值 问题 必定 是 良好 的 , 虽然 对 特征 疝 量 问题 
末 必 如 此 。 
现在 考察 x(H) 与 |s7!'| 的 关系 ,后 者 支配 着 单个 特征 值 的 
敏感 性 .相应 于 4 的 规范 化 右 特征 向 量 与 左 特征 向 量 为 
x = HeiflHeils, % = (HT Te (HT) ei 《31.3) 
因此 根据 定义 


lsl= x] 一 


ef HiHe; 
Wel Yeh 
1 
ET Ga 
我 们 有 
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lHeslh < HIb)eil: ~ IH, (315) 
la ea < He = HO = NH), (31.6) 
由 此 得 
1 < x(H). {31.7) 
另 一 方面 , 我 们 可 以 将 互 的 列 取 为 wjsit， 将 HH-! 的 行 取 为 
好 /rt， 对 如 此 和 多 到 的 入， 
<(H) 一 IHIbIAT lh < HI Ts 


一 (E sr } 人 [| } 
一 六 ts, (31.8) 


要 全 面 了 解 4 的 特征 什 关 于 算 阵 元 素 摄 动 的 敏 且 性 ， 我 们 需 
要 邓 个 量 94/ gau， 因为 个 别 特征 值 关于 《的 个 别 元 素 活动 的 敏 
感性 可 以 很 不 相同 。 计 算 这 么 多 的 一 批 数 在 实际 工作 中 显然 是 不 
可 能 的 .一 种 合理 的 折 束 方案 是 规定 * 个 数 |?|, 我 们 称 它 为 4 
关于 特征 信和 问题 的 ” 条 件数 。 信 得 注意 的 是 。 为 了 求 出 <( 昌 ) 的 
和 近似值。 实际 上 我 们 往往 不 得 不 计算 出 近似 的 特征 向 量 系 。 得 到 
了 它们 之 后 ， 要 得 到 个 别 4 的 近似 信 比 得 到 a(H》 的 近似 信 更 
简单 些 。 


条 件数 的 不 变性 


32. 无 论 是 “ 还 是 ”条 件数 121， 对 酉 相似 变换 都 具有 很 和 
要 的 不 变性 。 事 实 上 ,若是 证 矩阵 并 且 
B= RAR, (32.1) 


则 相应 于 
HAH = diag(%;) (32.2) 
我 们 有 
H-'RHBRH 一 diag(2) 或 
(RH)-'B(RH) = diag(%,). (32.3) 
因此 , 8 的 谱 条 件数 #” 等 于 


+». 


x 一 (RH) HRA = Ht = #. 《32.4) 
类 似 地 , 若 xi 与 凡是 4 的 右 特征 向 量 与 左 特征 向 量 , 则 且 
的 相应 的 特征 向 量 是 
x = Rr y = Ry, 
因此 
sm ON: ~ YRTRY = YT RIRz ~ Yt — (32.5) 
这 样 ,个 别 特 征 值 的 敏感 性 关于 西 变换 是 不 变 的 。 


非常 病态 的 矩阵 


33. 相应 于 非 线性 初等 因子 的 特征 值 一 般 应 看 作为 病态 的 . 虽 
然 我 们 应 当 记 住 $ 26 的 讨论 ， 然 而 我 们 不 应 产生 错觉 , 认为 这 是 
病态 的 主要 形式 。 凤 使 特征 值 不 辕 并 且 隔 离 得 很 好 ， 它 们 仍 可 能 
是 很 病态 的 ， 下 面 的 例子 足以 说 明 这 一 点 。 

考察 20 阶 和 矩阵 4: 


20 20 
19 20 
4 一 18 20. » (33.1) 
“2 20 
1 
这 是 一 个 三 角形 矩阵 ， 所 以 其 特征 值 等 于 对 角 元 素 . 车 在 (20.1) 
位 置 加 上 一 个 元 素 8， 则 特征 方程 变 为 


(20 一 1)(19 — 1).….(1 — 1) = 20"8. (33.2) 

我 们 在 $9 已 经 看 到 , 对 充分 小 6， 特征 值 + 一 + 的 报 动 不 售 有 
5 的 分 数 次 器 , 若 记 

be) —r ~ Ke, (33.3) 


由 (33.2), 显然 可 得 

K. = 20%—1Y/(20 一 Dr 一 Di (33.4) 
对 所 有 的 +， 这 个 常数 是 很 大 的 。 最 小 绝对 值 为 Ki 与 Ka 最 
大 绝对 值 为 Kw 与 Ku。 实 际 上 ,我 们 有 
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—Ki= Kn S10(4.31), —Ku 一 Kos 102(3.98)。 《33.5) 
Ki 是 如 此 之 大 ， 以 致 线性 化 理论 无 法 应 用 ， 除 非 。 非常 小 ， 当 
sm 一 10 时 ,特征 值 列 于 表 ! 中 ,并 以 环绕 着 值 10.5 为 对 称 形式 
出 现 . 


表 1 摄 动 矩阵 的 特征 入 (s = 10-*) 


0.99575439 3.96533070 上 #1 .08773570 
20,00424561 17.03466930 寺 it ,08773570 
2.10924184 5.89397755-+i1 .94852927 
18.89075816 15.10602245-Li1 .94852927 
2.57488140 8.11807338 土 i2.52918173 
18.42511860 12.88192662 士 22.$2918173 


10.50000000 士 i2.73339736 


34. 相应 于 这 一 单个 摄 动 的 特征 值 的 变化 与 对 类 似 芍 摄 动 在 
Cula) 的 特征 全 的 变化 是 一 样 的 ， 而 后 一 矩阵 有 一 个 10 阶 初等 
因 了 于， 当日 一 0 时 ， 前 一 矩阵 的 报 动 最 终 为 6 量 级 而 后 一 矩阵 为 
e ”县 级 。 这 个 事实 只 有 当 我 们 考察 比 10-" 更 小 得 多 的 振动 时 才 
变 得 重要 起 来 。 

{33.1) 矩阵 特征 值 的 敏感 性 表明 。%w 必 为 很 小 ， 实 际 上 , 甜 
阵 4 相 应 于 1 一 + 的 特征 向 量 * 的 分 量 为 

Es 20—7. (20~7)(19—7)..... 


了 


一 2 (—207 7 
而 % 的 分 量 为 
[os 中 人 全 一 Dr -2, 
+ :]. (34.2) 


这 两 个 向 量 并 不 是 完全 按 2 范 数 规范 化 的 ,但 是 x 给 出 大 
小 的 一 个 很 好 估 值 。 实 际 上 ,我 们 有 


094 。 


BI) 一 (20 一 rz ~— 1)1120%. (34.3) 
而 (34.3) 右 端 的 倒数 正好 是 等 式 (33.4) 中 的 XK,1|， 注 意 ，4 与 
A7 相 应 的 特征 商量 几乎 是 正 交 的 . 虽然 严格 的 正 交 性 只 有 在 非 
线性 久子 时 才 有 ,但 是 甚至 对 特征 值 隔 离 得 很 好 的 矩阵 ,我 们 显然 
能 够 很 接近 于 正 交 人 狂 。 

可 以 预料 ， 存 在 一 个 接近 于 4 并且 有 某 些 非 线性 初等 因子 的 
矩阵 ， 很 容易 看 出 这 是 确实 的 。 事实 上 ， 我 们 可 以 利用 (20, 1) 
元 素 的 摄 动 来 构造 这 样 的 矩阵 。 相应 于 摄 动 s， 特 征 信 为 方程 
(33.2) 的 根 。 方 程 左 端 的 函数 关于 1 一 10.5 是 对 称 的 并 且 有 9 
个 极 大 与 10 个 极 小 。 若 我 们 从 零 开 始 增 大 s， 则 根 10 与 11 一 
起 移动 ,并 且 当 


侍 . 冯 . 9 ~ 20v8 (34.4) 
时 ,两 根 重合 于 10.3。 由 此 得 s 的 值 近似 地 为 7.8X10-"。 相 应 的 
初等 因子 必 为 二 次 , 这 是 因为 摄 动 抢 阵 (4 一 杂 ) 的 左上 角 的 19 
阶 和 矩阵 的 行列 式 等 于 20”, 所 以 对 任意 1 它 的 秩 为 9。 若 s 继续 
增 大 , 则 根 8 与 9 ,12 与 13 一 起 移动 ,并 且 由 于 对 称 性 ,对 某 个 e 
值 它们 相 重 合 . 这 时 矩阵 有 两 个 二 重 根 ,每 一 个 都 相应 于 二 次 初等 
因子 。 类似 地 ， 再 继续 增 大 s， 我 们 可 以 使 6 与 7。14 与 15 相 重 
合 ， 等 等 . 

35, 我 们 刚才 所 考察 的 矩阵 ， 它 所 有 的 特征 信 都 是 病态 的 ,可 
是 其 中 有 几 个 比 其 余 的 更 加 病态 ， 现 在 我 们 给 出 一 族 和 矩阵 例子 ， 
每 个 矩阵 的 特征 值 具有 极 不 相同 的 性 态 。 这 就 是 由 下 式 定 义 的 
3。 类 矩阵; 


a (一 D (x—2)...321 
(一 D Ce 一 D (n—2).321 
B= (a—2) (一 2 3 2 1 |, (35.1) 
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11 


当 # 一 12 时 , 头 几 个 5 的 量 级 为 1 ,而 最 后 3 个 的 量 级 为 107. 
当 “” 增 大 时 ， 最 小 特征 值 的 性 态 变 得 越 来 越 坏 ， 从 以 下 讨论 中 可 
以 清楚 君 出 ,有 几 个 特征 值 对 某 些 矩阵 元 素 的 微小 变化 非常 敏感 
对 此 逢 阵 的 行进 行 简 单 运算 可 知 ， 对 所 有 za。 此 矩阵 的 行列 式 等 
于 1。 车 将 (1, #) 位 置 的 元 素 换 为 《+ 十 se)， 则 行列 式 变 为 

1+{n — 1)!ls, {35.2) 
若 s = 10-0，2 一 20， 则 行列 式 从 1 变 到 (1 一 191 10~*), 后 者 
约 为 一 1.216 x 10'"。 但 矩阵 的 行列 式 等 于 其 特征 值 的 乘积 。 报 动 
矩阵 至 少 应 有 一 个 特征 值 与 佛 屹 阵 的 特征 值 差 别 极 大 ， 再 有 ， 当 
7 一 12 时 , (1, 12) 位 置 上 的 元 素 的 一 个 小 于 10 的 摄 动 将 产生 
一 个 二 次 因子 ， 根 据 我 的 经 验 ， 我 们 刚才 所 讨论 的 这 一 类 型 的 病 
态 比 与 非 线性 因子 直接 根 关 的 病态 更 为 重要 .正好 有 非 线性 因子 
的 矩阵 在 实际 工作 中 几乎 是 不 存在 的 ， 甚 至 在 理论 工作 中 ， 这 主 
要 是 一 些 形状 十 分 特殊 的 矩阵 ， 通 常 具 有 不 大 的 整数 系数 ， 若 这 
些 矩 阵 元 素 为 无 理 数 ,或 者 不 可 能 在 所 使 用 的 计算 机 上 精确 表 出 ， 
含 人 误差 通常 将 导 鞋 一 个 已 经 不 再 有 非 线性 初等 因子 的 矩阵 ， 另 
一 方面 ,具有 一 些小 # 的 矩阵 是 经 常 遇 到 的 。 


实 对 称 矩 阵 的 报 动 理论 

36. 以 下 几 节 中 ,我 们 专门 讨论 实 对 称 矩阵 的 摄 动 理论 ， 它 比 
一 般 矩 阵 的 报 动 理论 简单 一 些 . 这 是 由 于 两 组 向 量 *; 与 多 可 以 
到 成 相同 的 (即使 有 重 特征 值 ), 从 而 所 有 ” 等 于 1. 我们 在 $ 31 
到 经 指出 ， 实 对 称 矩 阵 的 特征 值 问题 总 是 好 条 件 的 .下 面 几 节 将 
要 证 明 的 基 些 结果 显然 可 以 立即 礁 广 到 整个 正规 拭 阵 族 ， 但 有 些 
只 能 推广 到 Hermite 矩阵 或 者 根本 不 能 推广 . 我 们 将 不 加 证 明 地 
指出 各 种 场合 下 相应 的 推广 。 


非 对 称 摄 动 
37. 有 时 我 们 对 于 对 称 矩 阵 的 非 对 称 摄 动感 到 兴趣 ,为 此 讨论 
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(4 + eB) 的 特征 值 。 此 处 4 是 对 称 的 。 但 3 是 非 对 称 的 。 由 
(30.6) 可 知 ，(4 十 s8) 的 每 个 特征 什 至 少 位 于 由 下 式 给 出 的 一 
个 罗盘 中 : 


1% — 21 < el lll ll, (37.1) 
因为 下 可 取 为 正 交 的 , 故 有 
[1 一 2 <slBl < (着 i151 <1). (37.2) 


其 次 。 我 们 知道 ， 若 任意 * 个 圆 盘 构成 一 连通 域 并 与 其 余 圆 盘 隅 
离 ， 则 此 域 中 恰好 有 * 个 特征 值 。 这 些 结果 显然 对 所 有 正规 矩阵 
均 成 立 。 

在 实 对 称 甜 阵 的 情形 , B 通常 为 实 矩阵 ,因此 〈4 十 s3) 的 
鱼 一 复 特征 信 必 定 以 共 孝 复数 对 形式 出 现 。 若 | 一 | 之 2ne 
0 关 i)， 则 第 i 个 圆 措 是 孤立 的 ， 它 怡 好 合 有 一 个 特征 秆 , 此 特 
征 信 因 而 必定 是 实 的 。 轩 此 ,着 4 的 所 有 特征 值 隔 间距 大 于 ?ne ， 
册 每 个 元 素 偶 然 有 一 个 按 模 小 于 的 非 对 称 摄 动 时 ， 仍 然 保 持 特 
征 值 是 实 的 并 且 是 单 重 的 ， 从 而 特征 商量 也 是 实 的 并 且 构 成 完全 
系 . 


对 称 摄 动 

38, 计算 实 对 称 矩 隆 特征 系 的 大 多 数 最 精确 方法 是 基于 利用 
正 交 相 似 变换 。 在 相 伙 的 经 过 变换 的 矩阵 中 ， 严 格 地 保持 着 对 称 
性 ,这 是 由 于 我 们 只 计算 这 些 矩 阵 的 上 三 角 部 分 ,并 且 使 对 角 线 下 
面 的 元 素 等 于 对 角 线 上 面 的 相应 元 素 而 形成 整个 矩阵 。 根 据 这 个 
原因 ,我 们 将 更 多 地 讨论 对 称 矩 阵 的 对 称 所 动 。 

当 摄 动 为 对 称 时 , 摄 动 后 乱 隆 必 有 实 特征 系 , 报 动 年 阵 也 是 如 
此 .自然 要 找 原 逢 阵 、 摄 动 阜 阵 \ 以 及 报 动 后 矩阵 的 特征 值 之 阅 的 
关系 .迄今 为 止 ， 我 们 得 到 的 大 部 分 结果 均 要 求 摄 动量 很 小 ， 另 
一 方面 将 看 到 ， 我 们 要 证 明 的 许多 结果 不 受 这 一 限制 的 约束 。 因 
此 ,我 们 可 以 省 去 5 而 记 

CwmA+B, (38.1) 

其 中 4，B8，C 都 是 实 对 称 矩 阵 ， 
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经 典 方法 


39. 根据 极 小 - 极 大 原理 ,有 一 些 非常 有 效 的 方法 可 用 来 研究 
两 个 对 称 矩阵 之 和 的 特征 值 。 我 们 从 比较 经 典 的 分 析 方 法 开始 ， 
部 分 的 原因 是 为 了 强调 它们 的 功效 ， 

我 们 首先 导出 加 边 对 角 矩 阵 的 一 个 简单 结果 ， 设 对 称 和 矩阵 X 
的 形式 为 


xz- 人 2 -一 | G1 1), (39.1) 
其 中 a。 为 《s 一 1) 维 向 量 ， 我 们 要 找 出 X 的 特征 值 与 m 的 关 
系 


” 设 。 只 有 + 个 分 量 不 为 办 ;车 4 为 堆 , 则 oi 便 是 的 特征 值 ， 
舌 当 了 只 与 后 (一 行 有 关 的 时 要 7， 和 


其 中 5 的 分 量 都 不 是 零 aise) 是 * 阶 的 ，diag(Y/) 是 为 
(n 一 1 一 1?) 阶 的 ，P; 与 yi 合 在 一 起 是 w 的 一 个 排列 . 注意 ， 
某 些 7; 可 以 是 diaglms) 的 重 特征 值 . 

因此 ,xX 的 特征 值 为 7; 以 及 矩阵 


oa: pb 
- | 半 es | (393) 
2。 | disg(p;) 
的 特征 值 。 车 * = 9， 则 Z 就 是 一 个 元 素 a。 所 以 X 的 特征 值 为 
diag(m) 的 特征 值 以 及 值 xz， 反 之 , 我 们 考察 Z 的 特征 多 项 式 , 即 
-DID)— DHT (39.4) 
iml 了 = fi 


假定 8; 中 只 有 :个 不 同 的 值 ,不 失 一 般 性 ,可 令 它 们 为 B,2,,-…，、 
B， 并 设 其 重 数 依 次 为 ri ra …， rr， 于 是 
i {39.5) 
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《当然 ,有 可 能 上 一 ，。 这 时 所 有 p; 均 为 单 的 .) 显然 , (39.4) 左 
端 有 因子 


(Bi — A 《39.6) 
因此 ，8p; 为 Z 的 特征 值 , 重 数 为 《~ 一 了 )。 
将 (39.4) 除 以 HU (8 一 ”我们 看 到 ，Zz 的 其 余 特 征 值 是 
方程 


上 


0—(e—D -DBD sa—f) (39.7) 


的 根 ,其 中 每 一 个 < 为 7; 个 与 B 有 关 的 好 之 和 ,因而 它 严 
格 地 大 于 零 ， 图 1 给 出 了 fx) 的 图 形 ,其 中 不 同 的 6 按 降序 排 


区 1 
显然 可 见 ,， a 一 从 %) 的 + 十 1 个 根 一 记 为 8 5， 
满足 关系 式 
op > 页 人 Bi 
PB> n> 一 oo。 (39.8) 

因此 ,X 的” 个 特征 值 分 成 三 组 。 

(i) 相应 于 ot 等 于 零 的 特征 值 Yi 7 …，yw-:- 它们 等 
于 o 中 的 "一 1 一 :个 数 。 

(i) 由 (ri 一 1 个 等 于 Bi(i 1 2 … 汶 的 值 所 组 成 
的 :一 + 个 特征 值 ,它们 等 于 or 中 另外 的 :一 上 个 数 。 


Bi 


(省 ) 2 十 1 个 特征 值 等 于 8 并 满足 关系 式 (39.8). 着 : 一 
0, 则 5 一 a。 

注意 ,在 (iD，{《ii) 两 组 中 ， 或 者 一 组 或 者 二 组 可 以 是 空 集 。 
在 任何 情形 下 ， 这 两 组 的 元 素 与 “< 无关。 若 X 的 特征 值 记 为 
GE 一 1，2,……， na) 且 以 降序 排列 ;并 设 wm 也 以 降序 排列 , 则 由 
上 述 列举 的 关于 的 性 质 立 即 可 得 

产生 着 《39.9) 

黎 句 话说 ,至 少 在 弱 意 义 下 ， 分 照 履 ， 

40. 现在 考察 矩阵 X" 的 特征 值 , 这 个 矩阵 是 将 X 中 的 = 换 成 
a 而 得 到 的 , 就 (iD，(ii) 两 组 而 论 ，X' 的 特征 值 与 X 的 相同 ， 
记 X 在 (六) 组 中 的 特征 值 为 如 ,56;,……, 8;m。 对 和 > 0 有 


时 -1+ 六 cz 一 六 > LOW 有 。 (4 


所 以 ,每 个 差 数 串 一 5 位 于 0 与 of 一 a 之 闻 ( 见 图 ,因此 可 
令 


6 = mi(e 一 oa) (40.2) 
其 中 

Om <<1, Sm= 1 (40,3) 
若 :一 0， 则 

Hime, dg, Ba a, 《40.4) 

于 是 在 所 有 情形 下 ,我们 可 写 

BB mi(o’ 一 (40.5) 
其 中 

0<m 人 1, Pm= 1 (40.6) 


因为 XxX 与 X” 的 其 余 特征 值 都 相同 ， 我 们 可 以 说 已 经 建立 了 X 的 
特征 值 入 1 …， 4。 与 X” 的 特征 值 1 2 …，。，h。 之 间 的 对 
应 关系 , 即 为 (40.7) 
Vo— lm me’ — 0), 
此 处 
OE ml, Dm 1, 
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其 中 ,对 《iD，(i) 两 组 中 的 特征 从 ,显然 有 mi 一 0. 
此 外 , 若 关 系 式 (40.7) 对 u 与 各 按 降序 排列 更 应 成 立 。 


秩 为 1 的 对 称 矩 阵 
41. 上 节 结 果 可 用 来 估计 
CmA+B (41.1) 
的 特征 值 ,此 处 4 与 了 都 是 对 称 矩 阵 , 并 且 B83 的 秩 为 1。 这 时 存在 
正 交 矩阵 R， 使 得 


[5 
RIBR = | -1 ， {41.2) 
olo 
其 中 。 是 8 的 唯一 非 零 特征 值 。 若 记 
wa | i | {41.3) 
则 存在 (n 一 1) 阶 正 交 矩阵 5， 使 得 
ST74。13 一 diag(e;), (41.4) 
若 我 们 定义 为 
(41.5) 
网 9 正 交 , 并 且 
Qt(4+8)0= | 
十 | | 《41.67 
其 中 5 一 Sa， 因此 ,4 与 4 十 8 的 特征 值 等 于 
ee! Bb Ea 
[2 与 | . | (41.7) 
5 \diag(e;) } diag(o;) 


的 特征 值 . 若 将 这 些 特征 信 按 降序 记 为 % 与 如 ， 则 它们 满足 关 
系 式 
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站 一 2 一 pap， 《41.8) 

此 处 Om 人 1, Dm 1. 
所 以 ， 当 8 加 到 4 上 之 后 , 4 的 所 有 特征 值得 到 一 个 改变 量 , 它 界 
于 零 与 3 的 特征 值 。 之 间 。 

附带 说 一 下 ,由 $ 39 末尾 的 附注 以 及 (41.7) 所 给 出 的 4 的 变 
换 ， 显 然 可 知 : 4 的 主子 式 4,-， 的 特征 值 至 少 在 弱 意 义 下 分 隔 
4 的 特征 值 . 若 4 有 一 个 和 重 特征 值 r+。 则 4。-, 必 有 特征 值 zw， 
其 重 数 为 和 一 1, 不 或 天 十 1 


特征 值 的 极 值 性 质 


42. 在 介绍 特征 值 的 极 小 - 极 天 性 质 之 前 ;我们 考察 函数 xT4x 
在 条 件 x*x ~ 1 约束 之 下 确定 最 大 值 M 的 问题 显然 ,MM 也 满足 
关系 式 


M 一 max(zTAx/ x), (42.1) 
因为 4 是 对 称 和 矩阵 ,所 以 存在 正 交 和 矩阵 R， 使 得 
RIAR = diag( 2). (42.2) 
若 引 进 新 变量 y, 令 
zx 一 Ry， 即 y= Rix, 《42.37 
由 
TAX 一 ITRTARY 一 yTdiag( 1)y 
一 bp by, (42.4) 
7 
xTx 一 JTRTRY 一 py 六 (42.5} 


现 因 (42.3) 建立 了 与 ”之 间 的 一 一 对 应 , 原 问题 等 价 于 求 
于 48 在 条 件 六 并 一 1 之 下 的 最 大 值 ， 基 假定 4 按 降序 拓 


列 ， 则 显然 最 大 值 为 ， 它 在 ? 一。， 时 达到 。 相 应 的 向 量 * 为 
nr 即 尺 的 第 一 列 , 它 实际 上 就 是 4 的 相应 于 特征 值 2 的 特征 向 
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量 。( 注 意 , 若 丸 一 4 二 二 天 和 ny， 则 由 ee er 张 
成 的 子 空间 中 的 任 一 单位 向 量 均 给 出 值 2,) 类 似 地 , 4。 为 xzdx 
在 同一 条 件 下 的 最 小 值 ， 

现在 我 们 考察 同一 个 最 大 信和 问题 ,但 加 上 约束 条 件 , 即 与 
正 交 ， 由 关系 式 

OrIr = riRy = el RIRy = ely (42.6) 

可 知 ， 加 在 ”上 的 相应 的 约束 条 件 为 它 的 第 一 分 量 并 且 它 应 等 于 
零 。 于 是 , 在 此 约束 下 ，xr4x 的 最 大 信 为 0， 它 在 ) 一 c2， 亦 
即 x 一 +， 时 达到 。 类 似 地 ， 我 们 得 到 ， 在 附加 约束 rix 一 
jz 一.… 一 ?Ix 之 下 xdx 的 最 大 值 为 yi 它 在 z 一 ra 时 
达到 。 

特征 值 的 这 种 刻 划 有 一 个 缺点 ， 即 每 个 4 的 确定 都 依赖 于 
对 4 的 相应 于 4, 为,……, 4- 的 特征 向 量 mm， 的 了 
解 。 


特征 信 的 极 小 - 极 大 性 质 


43, 现在 我 们 来 刻 划 特征 什 〔 例 如 ,参见 Courant 与 Hilbert， 
数学 物理 方法 ， 第 一 卷 ), 它 没有 上 面 所 指出 的 缺点 考察 x*Ax 
的 最 大 值 , 条 件 是 

xx 一 】 
{ro, Pr 0 Gm ls 2 sss < 7), 

其 中 Pp; 是 任意 的 :个 非 零 向 量 ， 换 句 话说， 只 考察 满足 : 
个 线性 关系 的 zx 值 。 对 一 切 *， 我 们 有 

hrTAr Sh (43.2) 
所 以 xz4* 有 界 ， 其 最 大 值 显然 是 pi 的 ms 个 分 量 的 函数 。 现 
在 我 们 问 :“ 对 于 :个 向 量 Pi 的 所 有 可 能 的 选择 , 这 一 最 大 值 所 
取 的 最 小 值 是 什么 ? ” 

与 前 面 一 样 ， 我 们 可 用 《42,3) 所 定义 的 》 来 讨论 。 关系 式 
《43.1) 变 为 


(43.1) 
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{7 ~1, C43.3) 


gy—0, gg = PR0 

现在 考察 任 一 特殊 的 选取 请, Pp,,.……,p,。 它 给 出 一 组 相应 的 gq。 

所 以 ”个 变量 为 浇 足 :个 线性 齐 次 方程 。 攻 再 附 加 以 下 关系 式 

yb 一 mm 《43.4) 

则 得 到 * 个 未 知 量 为, 为 ,…*, ?的 总 共 * 一 1 个 齐 次 方程 , 因 
而 至 少 有 一 个 非 零 解 

《5 为 000) (43.5) 


可 规 净化 为 人 中 一 1。 对 这 样 选 择 的 7。 我 们 有 


yrdiag(h)y 一 by LF bin (43.6) 
和 
这 表明 ,不 管 如 何 选取 p:。 总 是 有 y， 从 而 有 *， 使 得 
zx 一 YTdiag( Ni) > Aone 《43.7) 
因此 
max(xTAx) > hn (43.8) 
这 意味 次 
min max xTAx > ln, {43.9) 
然而 ,着 取 P; 一 Rei， 则 97 一 cf。 关系 式 (43.3) 变 为 
0 (i=1,2,.,5), {43.10) 
因此 ,对 任 一 满足 这 些 特殊 关系 式 的 y， 我 们 有 
xTAx 一 Jrdiag(1)7 一 > Ly hn (43.11) 
s+ 
因此 得 
max(xTAx) < hn, (43.12) 
关系 式 (43.8) 与 (43.12) 合 在 一 起 表明 ,对 这 样 选择 的 p;， 
max(xz74xz) = sis (43.13) 
这 个 值 当 > 满足 (43.14) 时 确实 达到 。 
0 1) {43.14) 


因此 , 当 * 满足 :个 线性 关系 时 ，mix max(x74+) 等 于 hw。 这 
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明了 至 少 存 在 一 组 p; 与 一 个 相应 的 *， 。 达到 这 个 极 小 - 极 大 
值 . 
完全 类 似 地 ,我 们 可 以 证 明 
f’ 一 max min(xTAx) (43.15) 
zr 1, pr = 0 (0 一 12 一 
注意 ,在 两 种 刻 划 中 ,名 个 向 量 组 p; 中 包括 了 某 些 相等 的 p;. 
然而 ,一 般 而 言 ,最 大 值 的 真正 最 小 是 对 不 同 的 一 组 如 达到 的 . 若 
我 们 有 任意 的 :个 向 量 如， 则 可 断定 
bn mx(xiAx) (43.16) 
当 xiz 一 1, PJx 一 0(i 一 1,2,"…, :不 沦 所 有 的 pr 是 否 不 同 。 


两 个 对 称 矩 阵 之 和 的 特征 值 


44. 特征 值 的 极 小 - 极 大 性 质 可 用 来 建立 对 称 矩 降 4, B,C 
的 特征 值 之 闻 的 关系 , 此 处 
C 一 4 十 B。 (44.1) 
记 4, B,C 的 特征 值 分 别 为 oj/，P:，Y1s 并 设 这 三 组 的 值 均 按 
降序 排列 。 根 据 极 小 - 极 大 定理 ,有 


Yi min max(xTrCx) 
ro 2，……，5 一 1 (442) 
因此 , 若 任 取 一 组 特殊 的 p;， 则 对 于 相应 的 *， 我 们 有 
Tr max(zTCzr) 一 max(xTAx + xTBx), (44.3) 
若是 正 交 矩阵 , 它 使 得 
RIAR = diag(ar)。 (44.4) 


则 取 p; 一 Re; 便 使 下 述 关系 式 满足 
0 一 px 一 cf (i= 1,2,.,s ~ 1). 《44.5) 
由 此 组 p; 得 知 , > 的 前 〈* 一 1) 个 分 量 为 零 . 由 《44.3) 得 


2 二 max(zT4dx + xzTBx) 一 
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max 全 wy 十 Bx } (44.6) 


但 是 
区 oy Es (44.7) 
同时 对 于 任何 x， 
BrP, (44.8) 


所 以 对 相应 于 这 组 的 任何 x， 插 号 中 的 式 子 不 大 于 os 十 局。 
因此 , 它 的 最 大 值 不 大 于 o, + 如 ， 我 们 得 到 
YE 十 (44.9) 

因为 4 一 C 十 (一 8)， 然 而 (一 8) 的 特征 值 按 降序 排列 为 
一 BP.， 一 Bn-:，"…, 一 Bt。 应 用 刚才 证 明 的 结果 ,得 到 

T+ (一 如) 或 Yi 之 0 二 {44.10) 
关系 式 (44.9) 与 (44.10) 表明 , 当 召 加 到 4 上 之 后 , 4 的 所 有 特征 
值得 到 一 个 改变 量 ， 它 界 于 了 的 最 小 与 最 大 特征 信之 间 。 这 与 我 
们 在 $ 41 中 用 分 析 方法 对 秩 为 1 的 矩阵 号 所 证 明 的 结果 是 一 致 
的 注意 ,我 们 这 里 没有 特别 假定 摄 动 是 很 小 ;而 且 这 些 结果 不 受 
4，B，C 的 特征 值 重 数 的 影响 。 


实际 应 用 


45. 上 节 的 结果 是 实际 中 最 有 用 的 结果 之 一 。 通常 了 是 很 小 
的 ， 而 且 我 们 仅 有 的 信息 是 它 的 元 素 或 某 种 范 数 的 某 个 上 界 . 例 
如 , 若 我 们 有 


bil Ss, 《45.1) 
则 
—ne Ef, EP ns, (45.2) 
于 是 
17, 一 | en (45.3) 


这 比 我 们 在 $ 37 中 对 非 对 称 摄 动 的 已 有 结果 更 强 些 , 因为 现在 没 
有 对 wr，Pi，Y: 的 分 隔 加 以 限制 。 以 前 我 们 只 是 当 所 有 特征 值 


= 06 


阐 隔 大 于 2xs 时 能 够 证 明 关系 式 (45.3)。 


极 小 - 极 大 原理 的 进一步 应 用 
46. 5 44 所 得 的 结果 可 以 推广 为 
Yooat+p (r+s—1len), (46.1) 
证 明 如 下 . 
至 少 存在 一 组 名 ， 使 得 
max(x7Ax) 一 a 条件 为 Px 一 0 


(一 1 2 一 1)。 (46.2) 
以 及 一 组 91/， 使 得 
max(x7Bx) 一 8， 条 件 为 9Fz 一 0 
(一 12 一 了 (46.3) 


现在 考虑 同时 满足 pfx 一 0 与 4fz 一 0 的 * 的 集合 , 这 种 非 堆 
* 是 存在 的 ， 因 为 方程 的 总 数 是 r 十 ;一 2， 而 由 (46.1) 可 知 。 
它 不 大 于 = 一 1。 对 任 一 个 这 种 x， 我 们 有 

xICx = ztAr+ xTBr Eo +p, (46.4) 
因此 ， 对 所 有 满足 (46.2) 与 (46.3) 共 r 十 :一 2 个 线性 方程 的 
xz， 有 

max(xTCx] < a + Bo, (46.5) 

于 是 

Tri 一 min max(xT Cx) So, + Ph, {46.6) 
因为 这 里 的 最 小 值 是 在 所 有 满足 + 十 :一 2 个 关系 式 的 集合 上 
取 的 。 


分 陶 定 理 


47. 作为 进一步 应 用 极 小 - 极 大 定理 的 例题 ， 我 们 证明， 逢 阵 
4。 的 前 主子 式 4 的 特征 值 如 , 必 ,……., 思 - 分 隔 4 的 特征 值 
ja 和。 在 5$41 中 用 分 析 方法 对 最 下 面 一 个 (4 一 1) 阶 
主子 式 证 明 过 这 个 结果 ; 显然 , 它 踊 然 对 此 主子 式 成 立 , 用 置换 答 
阵 作 相 似 变换 即 可 君 出 ,对 一 切 〈* 一 1》 阶 主子 式 也 成 立 。 
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xzT4w-ix 对 一 著 (4 一 1) 维 规范 化 向 量 * 所 取 的 值 的 集合 ， 
与 x74nx 对 一 切 满足 条 件 x。 一 0 的 =” 维 规范 化 向 量 所 取 的 值 
的 集合 是 相同 的 .因此 
{ Vminmax(xTAsx), rTr— 1 
"x,—0, pr=0 (i=1,2,..,:—1) 
此 最 大 值 将 在 某 一 组 p;: 上 达到 .对 这 组 pi,4; 为 x74nx 在 (47.1) 
第 二 行 的 :个 线性 关系 下 的 最 大 值 。 然 而 ，h+， 为 此 最 大 值 在 任 
意 : 个 线性 关系 下 的 最 小 值 ， 因 此 
Ln (47.2) 
现在 考虑 任 选 的 一 组 :一 1 个 向 量 pi。 对 满足 相应 的 线性 
关系 式 的 规范 化 向 量 x*， 记 xzr4ex 的 最 大 值 为 如 (oz)。 设 在 附 
加 条 件 x。 一 0 之 下 ,此 最 大 值 记 为 j。_,(p:)， 则 显然 有 


(47.1) 


fpr) folpi), (47.3) 
从 面 
minf, (pi) < minf, (Pi). (47.4) 
由 此 得 ” 量 
hb 《47.5) 


最 后 6 节 的 全 部 理论 可 立即 推广 到 一 般 的 Hermite 矩阵 ; 将 
各 处 出 现 的 上 标 了 改 为 瑟 即 得 到 全 部 结果 与 证 明 ， 


Wielandt-Hoffman 定理 


48. 有 另 一 种 类 型 的 定理 ， 它 与 我 们 已 经 讨论 的 不 同 , 它 将 特 
征 值 的 摄 动 与 摄 动 抵 阵 的 Euclid 范 数 联 系 起 来 。 下 面 的 定理 属 
于 Hoffman 与 Wiclandt (1953)。 

着 C 一 4 十 B， 此 处 4，8。C 均 为 对 称 纸 陈 。 基 生年 人 
分 列 记 为 mw。 Ai。 mm 并 控 降 席 拓 列 , 则 


六 <la 一 训 轴 . (48.0 
2 


Hoffman 与 Wiclandt 给 了 一 个 非常 漂亮 的 证 明 ， 它 与 线性 规划 
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理论 有 关 。 下 面 的 证 明 不 甚 巧妙 但 较为 初等 。 它 实质 上 应 归功 于 
Givens〔〈1954)。 

我 们 需要 两 个 简单 的 引 理 ， 

(i) 若 对 称 矩 阵 X 的 特征 值 为 入 ， 则 


1x = 六 。 048.2) 

事实 上 ,存在 正 交 和 矩阵 使 得 
RIXR = diag(hi). (48.3) 
两 端 取 Eudid 范 数 ， 由 Eodid 范 数 关于 正 交 变换 的 不 变性 即 得 


所 需 结 果 . 
(i) 车 RL.，R;,"……，。 为 正 交 矩阵 的 一 个 无 穷 序 列 , 则 存在 子 
序列 RR。,s，*… 使 得 
lim Ru = R. (48.4) 
这 是 由 于 所 有 R, 的 各 个 元 素 均 位 于 区 间 [一 1, 1] 之 中 ， 由 几 
维 空间 的 “Bolzano- Weistrass 定理 到 的 所 需 结果 。 因 为 


RER, = 1, (48.5) 
取 极限 得 
RzR 一 了 (48.6) 
所 以 矩阵 尺 必 为 正 交 。 
49. 现 设 R 与 Ra 为 正 交 矩阵 , 它 使 得 
RIBR, 一 diag(8)，RICR: 一 diag(7i), (49.1) 
则 


diag(8) 一 RIBR, = RILC — A1R, 
一 RILRdiag(Y;) RI — AlR, 
一 RIR,ldiag(7;) 一 RIAR]RIR,, (49-2) 
两 端 取 范 数 得 到 


FR liag(7) — AR. (049.3) 


现在 考察 ldisg(7i) 一 RT4RI3 一 作 R) 对 一 切 正 交 短 阵 R 所 取 
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之 什 的 集合 等 式 (49.3) 表明 ,8; 属于 此 集合。 这 个 入 显然 


是 有 界 的 ， 因 而 存在 有 限 的 上 界 # 与 下 界 1。 因为 忒 R) 是 正 交 
和 抑 阵 的 紧 尝 上 的 连续 函数 ,所 以 对 某 些 尽 这 两 个 界 一 定 能 达到 。 

50. 现在 我 们 证 明 。 : 必定 在 使 RI4R 为 对 角 和 给 阵 的 R 上 达 
到 , 设 mr 有 * 个 不 同 的 值 , 分 别 用 满足 下 式 的 54 一 1， 2 
r) 表示 


有 (50.1) 
我 们 可 号 
diag(77) 一 ， {50.2) 
. TT 
其 中 各 单位 阵 具有 相应 的 阶 数 。 若 将 RT4R 分 块 使 之 与 (50.2) 
一 致 ,我 们 可 写 
Xu Kn- Ky 
RAR -| Ni |- 0 
Xn Xr Ke 


首先 证 明 : 1 只 能 在 使 (50.3) 的 非 对 角 块 均 为 零 的 R 上 达到 ， 假 
定 RI4R 的 ? 行 9 列 有 一 个 非 零 元 素 z， 并 假定 此 元 素 在 Z 
(去 站 块 中 。 于 是 diag(71) 与 RYAR 的 p，4 两 行 两 列 交叉 
位 置 上 的 元 素 有 如 下 形式 


diag( 7;) X= RIAR 
尹 列 4 列 
| : 
BO 
i | 
一 0 一 一 2 一 一 4? 行 
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其 中 为 了 简单 起 见 省 略 了 和 中 有 关 元 素 的 足 标 ， 我 们 证 明 ， 可 以 
选取 初等 正 交 和 矩阵 5， 它 相应 于 〈?, 9) 平面 中 的 旋转 ,使 得 
q(s) = jdiag(y 门 — STRTARSH — ldiag(7;) 
— RIARIE < 0. (50.5) 
记 STRTARS 在 p,9 两 行 两 列 交叉 处 的 相应 元 素 为 a', x'，5'。 
由 于 
HSTRTARSIS = RTARNE, (50.6) 
容易 看 出 ， 由 Eudlid 范 数 的 定义 直接 可 得 
B(S$) 一 一 245i — 25"6; + 2a8; + 258; 
= 2(a 一 的 5 十 2(8 — 6")6;, (50.7) 
其 余 各 项 均 已 消去 .车 旋转 角 为 9， 则 
{ 4’ 一 ecosig 一 2xcosO sin8 十 bsin’, 


(50.8) 
b= using 十 2zcosgsin8 十 bcosg. 


由 此 得 
4(8) = 8(5) 一 25i[(a 一 5)sinog + x sin 20] 
+ 20[(8 — a)sin’9 — xsin 20] 
~ Psin’0 + QO sin 20, 《50.9) 
其 中 2 去 0。 因 为 按 假 定 * 不 为 零 ， 同 时 8; 一 9 也 不 为 零 , 后 
者 由 于 6; 与 六 在 不 同 的 对 角 块 上 ， 于 是 我 们 有 


得 MB) = Psin 20 + 20cos26。 (50.10) 


因此 , 当 6 一 0 时 ,导数 等 于 28。 这 表明 , 选取 适当 的 6， 可 使 
8(5)> 0 或 gt5) 过 0. 

51. 这 样 ， 我 们 证 明了 ， 区 R) 不 可 能 在 使 得 XX 中 的 任 一 块 
Xu(i 关门 有 非 堆 元素 的 R 上 达到 极 大 或 极 小 。 现 在 假定 尽 为 正 
交 和 矩阵 , 它 使 万 R) 达到 极 小 值 , 则 必 有 


| al 
disg(7) — RTAR=| 1, 


ell* 


一 -. 。 (51.1) 


车 多 为 正 交 和 矩阵 ,使 得 
QFXiQi 一 Di， (G51.2) 
其 中 D， 为 对 角 和 矩阵 。 记 8; 的 直接 和 为 9， 则 有 
Qrdisg(71)0 一 OTRTARO 


ol D, 
_| 时 _| 
81 ‘D, 
~ diag(77) — OTRTARQ. (51.3) 
因此 
(RO) = fH(R), (51.4) 


并 且 极 小 值 总 是 在 使 4 化 为 对 第 型 的 矩阵 RO 上 达到 ,显然 ,， 书 
的 元 素 为 按 某 种 次 序 的 sy。 注意 到 具有 适当 重 数 的 3 即 为 7，， 
我 们 有 

minf(R) = 二 (7 — oi), (51.5) 


其 中 六 加 为 1, 2, … ,2 的 一 个 排列 . 
现在 征明, 极 小 值 当 p; 二 i 时 达到 。 我 们 对 某 种 特殊 排列 ， 
记 
xm 7 一 oz (51.6) 
车 户 关 1， 则 设 疡 一 1， 于 是 7, 与 m% 相 匹 配 , 在 排列 中 交换 
名 与 p.，。x 的 改变 由 下 式 给 定 为 
(一 ao 十 《7 一 op 一 (7 一 ap 一 (7 一 区 
一 一 2(7, 一 Yar 一 ai) 和 <0. {51.7) 
因此 和 数 减 少 。 类 似 地 ， 保 持 第 一 位 置 上 的 ma。 并 使 7; 与 om 
结 成 对 ， 我 们 仍然 看 到 ,和 数 不 增 大 。 因 此 , 若 将 每 个 & 与 相应 
的 >， 结 成 对 ,到 和 数 不 大 于 它 的 初始 值 , 
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这 样 , 我 们 最 后 的 结论 是 : R) 的 极 小 值 等 于 王 (y, 一 ow》。 
然而 在 〈49.3) 中 已 证 明了 如 8 为 世 R) 可 取 的 信 , 因 此 

lB = 达 让 之 之 (ri — mw). (51.8) 
证 明 完 毕 。 

52. 这 一 证 明显 然 可 推广 到 Hermite 矩阵 ， 但 其 结果 对 任 一 
正规 矩阵 也 成 立 。 类似 的 证 明 方法 可 用 于 一 般 的 情形 。 可 是 如 今 
在 (50.4) 中 (p,q) 与 (4, 位 置 二 的 元 素 不 再 为 复 共 锯 。 利 
用 第 一 章 等 式 (43.4) 的 平面 旋转 矩阵 ， 我 们 可 以 证 明 , 当 R44R 
为 对 角 短 阵 时 相应 的 极 小 值 被 达到 。 这 一 细节 留 作 练习 题 。 
附注 。 

虽然 85 一 $12 的 材料 实质 上 是 经 典 摄 动 理论 ,但 在 文献 中 似 
平 不 容易 得 到 一 种 斤 述 简单 而 又 严格 的 资料 ， 

Gerschgorin 定理 已 被 广泛 用 于 特征 值 的 定位 ，Tausky 是 一 
位 特别 热心 的 提倡 者 ; 她 (于 1949 年 ) 对 这 个 定理 及 其 推广 作 了 
有 意义 的 讨论 。 在 Gerschgorin 的 不 来 论文 中 (1931), 讨论 了 利 
用 对 角 相 似 变换 来 改进 特征 值 的 定位 ， 但 将 这 一 方法 推广 到 得 出 
经 典 摄 动 理论 的 结果 及 其 严格 的 误差 界限 似乎 是 新 的 。 

Houscholder 在 他 的 《数值 分 析 中 的 矩阵 论 } 一 书 的 第 三 章 中 ， 
通过 范 数 的 应 用 ， 给 出 了 关于 特征 值 的 包含 与 排除 区 域 的 非常 详 
尽 的 叙述 。 这 一 章 也 包括 了 由 极 小 - 极 大 原理 的 推广 所 得 出 结果 
的 讨论 . 

Widandt 与 Hoffman 定理 似乎 没有 像 由 范 数 的 直接 应 用 所 
得 出 的 定理 那样 引起 更 多 的 注意 。 根据 我 的 经 验 ， 对 于 以 泽 点 算 
术 运 算 的 正 交 变 换 为 基础 的 误差 分 析 是 最 有 用 的 结果 。 
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第 三 章 误差 分 析 


引言 


1. 由 于 本 书 的 主要 目的 是 对 求解 代数 特征 值 问 题 的 各 种 方法 
作 比较 竹 评 价 ， 因 而 我 们 把 许多 比较 重要 的 方法 的 误差 分 析 包 括 
在 本 书 之 中 。 做 这 样 的 分 析 自 然 需要 了 解 基本 算术 运算 在 数字 计 
算 机 上 是 怎样 完成 的 。 在 Wilkinson (1963b) 的 第 一 章 中 , 我 已 
相当 详细 地 分 析 了 这 些 运算 中 的 伟人 误差 ， 并 且 讨论 了 现代 计算 
机 中 所 出 现 的 各 种 主要 变型 

我 们 假定 读者 熟悉 这 些 内 容 ， 对 本 书 讲 用 到 的 结果 我 们 只 给 
出 一 个 简明 的 摘 楼。 让 于 我 们 得 到 的 误差 界 对 现 有 的 各 种 舍 人 过 
程 并 不 十 分 敏感 ， 因 此 只 限于 讨论 一 组 特定 的 舍 人 过 程 就 较为 简 
单 .我 们 不 仅 讨 论 定 点 计算 也 讨论 浮 点 计算 ， 并 假定 自始至终 使 
用 二 进 制 算术 运算 .然而 ,经 常 举 些 简单 例子 是 有 益 的 ,几乎 所 有 
这 些 例子 都 是 在 十 进 制 的 台式 计算 机 上 完成 的 。 由 于 从 二 进 制 转 
换 为 十 进 制 可 能 引进 合 人 误差 。 因 此 在 自动 计算 机 上 完成 这 样 的 
计算 是 不 能 令 人 满意 的 。 
定点 运算 

2. 假定 在 定点 计算 中 凡是 需要 就 引 人 比 例 因子 。 这 样 每 个 数 
zx 都 属于 标准 范围 

一 I<xr 反 1 (2.1) 

不 必 费 心 去 排除 其 两 个 端点 ， 因 为 这 样 会 使 误差 分 析 非 本 质地 复 
杂 化 .假定 在 二 进位 的 小 数 点 后 有 : 位 数字 ,尽管 可 能 需要 * 十 1 
位 才能 表示 一 个 数 ,我 们 还 是 说 计算 机 有 “:， 位 字 长 " 

形 如 


lla. 


x 
x 一 州 * 土 9 (2.2) 


的 方程 式 ,表示 xz，y 和 * 都 是 标准 定点 数 ,并 且 是 x 和 Y 作 适 
当 定 点 运算 得 到 的 。 对 于 加 法 ,减法 和 除法 ,我 们 假定 计算 所 得 到 
的 “不 超出 容许 范 
加 法 或 大 法 没有 合 人 误 这 。 所 以 ,我 们 有 

sfx 土 y) 过 < 士 ?， (2.3) 
其 中 , (2.3) 的 最 后 一 项 表示 准确 的 和 或 差 . 等 价 符号 用 来 强调 已 
考虑 了 合 人 误差 。 这 有 助 于 区 别 计算 方程 式 和 用 于 找 述 算法 的 数 
学 方程 式 。 和 梁 法 和 除法 一 般 有 含 人 误差 .我 们 假定 伟人 过 程 使 得 


(XxX, Nx 
其 中 二 一 (9 二 区》 十 e (2.4) 
{fel <2 (2.5) 
我 们 强调 一 下 ， 《2.4) 中 右边 的 项 x ~ 二 7” 表示 准确 的 积 或 商 ， 所 
以 ,符号 “xX” 和 “二 ”有 其 通常 的 算术 意义 。 


内 积 的 累加 
3. 许 多 计算 机 上 ， 不 需要 特殊 的 程序 设计 就 可 按 定点 运算 准 
确 地 算出 (只 要 不 发 生 上 滋 ) 内 积 
RX tn XX yo (3.1) 


一 般 来 说 ， 需 要 二 进 制 小 数 点 后 有 2z 位 才能 准确 表示 (3.1) 中 的 
和 。 若 z 为 准确 地 累加 (3.1) 中 的 内 积 并 将 其 结果 伟人 成 标准 的 
定点 数 所 得 出 的 数 , 则 记 为 
2 一 (十 XX 十 二 x X97)， (32) 
这 里 下 标 “2” 表 示 使 用 准确 的 累加 。 在 我 们 的 会 人 过 程 下 ， 就 有 
和 一 有 (rrX 入 十 为 X 为 十 十 和 Xy) 
= 辫 人 十 ey (3.3) 


lsl 2™, (3.4) 
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其 中 


而 有 (mx 六 十 二 X 为 十 二 各 X 加 ) 二 并 2 和 十 8 
各 


其 中 (3.5) 
le) < 2 (3.6) 
拥有 内 积累 加 设备 的 计算 机 ， 租 常 设计 成 可 以 接受 二 进 制 小 数 点 
后 有 2: 位 的 被 除数 ， 并 用 标准 定点 数 去 除 它 ,得 出 会 人 后 的 定点 
的 商 。 我 们 将 它 记 为 
红 二 所 [sy XX 玉 十 二 XX 为 十 十 zo X ya)f] 


其 中 > 
= [人 及 ) 十 8， (3.7) 
Isl 27 (3.8) 

因此 
[wz 一 六 xl = ze| S21sl, (3.9) 
LE 
我 们 将 很 良 由 地 使 用 记号 大 ) 和 所 (”)。 例 如 ,车 

C=fi,l4 x B), (3.10) 


其 中 4，B，C 是 笼 阵 ，4，B，C 的 所 有 元 来 都 是 定点 数 , 并 
且 每 个 cj 定义 为 : 
ci filan X Bot an Xbjt tan X br) (3.11) 
若 C 可 以 无 上 洲 地 表示 , 则 有 
C=fil4d x B= AB+F, 
{ lisl < 2°", 
自然 ,这 里 48 表示 准确 的 矩阵 乘积 . 
应 该 注意 ,在 fi( ”) 中 括号 内 的 表达 式 非 常 复杂 时 , 得 出 的 
结果 可 能 取决 于 运算 完成 的 次 序 , 这 时 就 需 赛 给 它 规 定 次 序 。 


浮 点 运算 


生 浮 点 计算 中 ， 每 个 标准 数 > 由 有 序数 对 < 和 “上 表示 ， 即 
= 一 224; 其 中 4 为 正 或 负 的 整数 ,而 “满足 如 下 关系 


-二 >a> 一 1 或 到 < os (4.1) 


(3.12) 


ie» 


我 们 把 b 称 作 指数 ,a 称 作 尾数 .假定 。 在 二 进 制 小 数 点 后 有 : 位 
数字 。 则 称 计算 机 有 “; 位 尾数 "。 虽然 实际 上 某 些 可 用 两 种 方式 
工作 的 计算 机 中 。 与。 的 位 数 合 起 来 与 定点 歼 的 位 数 相同 ,而 我 
们 还 是 采用 与 定点 计算 中 相同 的 符号 “/” 来 表示 。 对 定点 计算 
和 泽 点 计算 的 误差 界 进行 比较 时 。 记 住 这 一 点 是 重要 的 。 还 假定 
数 零 有 非 标准 的 表示 , 即 “一 “一 0。 


形 如 
十 
3) (4.2) 


的 方程 式 含义 为 z，y 和 = 均 为 标准 浮 点 数 ， 并 且 * 是 对 = 和? 
施行 适当 的 序 点 运算 而 得 的 结果 。 假定 这 些 运算 中 的 伟人 误差 使 
得 


十 十 
其 中 2) (ere {4.3) 


lel < 2 {4.4) 
所 以 ， 每 一 单个 的 算术 运算 所 得 的 结果 均 有 小 的 含 人 误差 。 如 
Wilkinson (1963b) 中 第 II 页 所 指出 , 某 些 计算 机 的 伟人 过 程 使 得 
加 法 和 减法 所 得 的 结 染 不 一 定 有 小 的 相对 误差 ,但 对 大 量 计算 所 
得 的 误差 界 来 说 ,差别 是 微不足道 的 。 


误差 界 的 简化 表示 


5. 为 方便 起 见 ， 我 们 把 本 书 中 要 反复 使 用 的 许多 结果 收集 在 
这 里 .它们 都 是 (4.3) 和 (4.4) 的 直接 推论 。 然 而 ,使 用 这 些 关 系 
式 经 常 首先 导致 如 下 形式 的 界 ， 

(1 一 270<1+s 和 (1 十 2) (5.1) 


实际 记 用 中 ，。， 六 足 如 下 条 任 
r2 < 0.1， (5.2) 


对 于 适当 的 * 值 , 若 存储 容量 不 加 限制 ,这 一 点 似乎 不 会 给 ” 带 来 
任何 限制 。 由 条 件 〈5.2), 我 们 有 


(1 二 2 <1TT(106)r2- 
{a — 27)> 1 (1.06)r27, (5.3) 
为 进一步 简化 这 些 表 达 式 ,我 们 引进 a， 其 定义 为 
2 一 〈1.06)2-， (5.4) 
即 i loga(1.06) 一 上 一 0.08406， (5.5) 


所 以 4 与 + 仅 稍 有 不 同 。 在 以 后 的 所 有 误差 界 中 ,只 要 有 利于 研 


究 ,我 们 就 用 下 式 代替 关系 式 (5. 1 而 条 件 (5. 2) 则 是 不 言 耐 只 的 、 


Isl < 26, (5.6) 
革 些 基本 浮 点 计算 的 误差 界 
和 现在 我 们 不 加 证 明 好 叙述 下 列 结果 
fix Xs Xe Xx)= (+8) 开 xiy (6.1) 
其 中 1E| < (w 一 D2™%, (6.2) 
{DD fim s+ x ) nl + 1) 
二 ml) (6.3) 
其 中 fal 之 (rw 一 1)24, |sl (nl—r)2n 
(r = 2 0). (6.4) 
上 面 式 子 中 的 运算 是 按 如 下 次 序 进行 的 : 


a fllnt sm) mm fllsat s) Cr — 3,.*, 1), 
(Ci) CTy) = fr Et mt) 
三 zl 6) + ri(l + 0) 


二 ro + es) (6.5) 
其 中 ls] < 2 1e| < (十 2 一 站 2 

人 一 2 (6.6) 
我 们 可 以 写 为 

有 (zzy) 一 xy xg, (6.7) 
其 中 2 一 diag(si]y， (6.8) 


slig8e 


这 一 基本 结果 的 有 用 推论 为 


[#7) 一 391 & Bll yllerl (6.9) 

nn2 zlTIy| 《6.10) 

安 92 zy。 (6.11) 

Gy) 着 C= 有 (4 十 8) 呈 4 十 8 十 ,其 中 (6.12) 

ci {ast bi)(l+ ew), les| E22. {6.13) 

从 而 有 isl = leal len + |, {6.14) 
因此 4 二 B) 一 (4 二 274 + Bl. (6.15) 


这 一 结果 仅 对 我 们 所 选取 的 特定 舍 人 过 程 是 正确 的 ， 而 对 其 他 合 
人 过 程 是 不 正确 的 . 以 后 我 们 很 少 使 用 它 . 但 是 无 疑 地 (6.15) 意 
昧 着 下 式 成 立 
H(A4+B)— (4+ BES2(IAI+|BI). (6.16) 
如果 在 这 一 误差 界 中 引入 一 个 额外 的 因子 ,比如 4, 上述 结 果 就 可 
直接 推广 到 我 已 研究 过 的 所 有 舍 人 过 程 . 
(Vv) 有 (4B) = 4B 十 ,其 中 (6.17) 
fi = anbyuel + anbyed + ot inboielh, (6.18) 
而 且 |stp| 之 n275， [een < Cn 2 一 rr)2 nr 一 2 2) 


(6.19) 

因此 1F| < [411DIBI < x2 411B1, (6.20) 
其 中 咏 为 对 角 和 矩 阵 ,其 元 素 为 

[ez2-4 pn20 Cn 一 1)2 9325 2 2], (6.21) 

(vi) fad) = ad 十 下 ,其 中 (6.22) 

= oasss lesl < 27. (6.23) 

因此 lii(e4) 一 ad1 2™|ell4i. (6.24) 

Cvii) #1(xy7) 三 zz 十 下， 其 中 (6.25) 

fu= ryiey leal < 2, 《6.26) 

因此 | 万 (z 字 ) 一 zy7| 寺 27]x4 jy {6.27) 

误 闲 矩阵 的 范 歼 的 界 


7. 在 应 用 刚才 得 到 的 那些 结果 时 ， 常 常 需要 误差 矩阵 的 某 种 


slH9» 


范 数 的 界 ， 若 以 矩阵 乘法 的 误差 界 (6.20) 为 例 , 则 有 


EEF 2 lal Bl (7.1) 
因此 ,对 于 Focid 弟 数 。! 范 洲 或 基数 ,有 
PE S21ANBl. (7.2) 
全 对 十 2 事 数 ,我 们 只 有 
BF 227 Ab llB ip. (7.3) 
《7.3) 中 的 界 , 实 际 上 弱 于 下 式 
Flis 227 A lal Blle. {7.4) 
这 是 因为 
IFh < HF 且 AhallBlle liAllB lb. (7.5) 
我 们 将 会 经 常 发 现 ， 用 2 范 数 得 出 的 界 弱 于 用 Eaclid 范 数 得 出 
的 界 . 但 是 ,要 注意 , 若 4 和 B 为 非 负 的 , 则 有 
PEF, 275AN BD. (7.6) 
这 一 结果 弱 于 《7.4) 中 的 结果 、 
浮 点 运算 中 内 积 的 黑 加 


&. 现在 制造 的 某 些 计算 机 上 , 对 于 尾数 为 2 位 2 进 制 数字 的 
数 ， 提 供 了 特殊 设备 来 作 加 减法 。 在 这 种 计算 机 上 , 连 加 f(x 十 
加 十 十) 与 内 积 f(a 二 训 入 十 十 xnyo) 一 样 ， 都 
可 以 按 2: 位 尾数 累加 .对 于 内 积 ,假定 *; 入 均 是 :位 尾数 的 标 
准 数 ,同样 , 计算 机 也 可 以 接受 有 2: 位 尾数 的 被 除数 ,并 除 以 一 个 
# 位 尾数 的 标准 数 . 国家 物理 实验 室 的 计算 机 ACE 上 ,有 一 套子 
程序 来 完成 这 些 运算 ， 所 花费 的 时 间 与 相应 标准 浮 点 运算 差不多 
是 同样 的 . 类似 于 符号 所 (”) 的 使 用 ,我 们 用 符号 f( ) 来 表 
示 这 些 运算 、 但 要 注意 ， 了 所 (xm 十 x3 十 … 十 ye) 一 般 并 不 给 出 
准确 的 和 , 

Wiikinson (1963b) 的 23 至 25 页 上 ,已 分 析 过 基本 的 4( ) 
运算 的 舍 入 误差 .这 里 不 去 重复 它 , 但 仍 有 必要 把 最 有 用 的 结果 简 
要 叙述 一 下 。 喜 接应 用 基本 算术 运算 的 误差 界 会 导致 如 下 形式 的 
办 
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(= 三 2 <ltsg (1+r32*), (8.1) 


三 72 01, (8.2) 
按 这 个 规定 ,由 (8.1) 可 得 到 
lal < 三 (1.06)r2-2。 《8.3) 
与 $5 中 4 的 定义 相应 ,我 们 定义 ,使 得 
2 一 (1.06)27, 26 一 22 一 0.08406。 (8.4) 
这 样 得 出 的 4 与 +， 仅 稍 有 点 不 同 。 现 在 由 (8.1) 可 得 
ls| < 三 2 (8.5) 


如 果 在 辣 一 计算 中 i(”) 与 如 (”) 两 者 都 用 到 ,那么 有 了 
条 件 (5.2), 条 件 (8.2) 就 是 多 余 的 了 。 


某 些 基本 所 (”) 计算 的 误 楚 界 


9 我 们 现在 不 加 证 明 地 叙述 下 列 基本 结果 。 
(DD fant mt tx) 
= [nlt 6) + nl ss) 
+ ll es) + 6), (9.1) 
Is] <27, lssl <30 — D2, 
。 (9.2) 
ls,l < +t 1— rr) (rr 一 2 


{9.1) 是 按 24 位 尾数 累加 有 求 和 , 然后 进行 伟人 .此 外 ,我 们 有 
f(a 二) 十 二 x)(l + 6) 
二 x 十 3283 十 -十 reg (9.3) 
其 中 《9.2) 的 界 仍然 适用 。 
[AC 
二 [rn(l + 6) + wys(l + 63) 
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十 …- 十 xayn(l 二 se)](1i 二 es)。 (9.4) 


1 3 ~ 
lel 2 Jal < 


: 3 (9.5) 
lol <3 (et 2 2 Cr 20 0), 
我 们 还 有 
ja(rTy) 一 zy(l Tt 6) 三 mayiel 十 xzya6 十 十 roynEs, 
(9.6) 


这 里 , (9.5) 中 的 界 仍然 适用 .重要 的 是 要 了 解 (9.6) 的 全 部 意义 . 
由 于 xzy 的 诸 项 之 阅 可 能 产生 严重 的 相约 , 我们 还 不 能 从 它 断 定 
f(x?y) 的 相对 误差 很 小 . 但 从 (9.6) 却 可 推 知 

WoC) — #1y| < lellxTy| + Ell lyrl le 


xTy| 十 nllriyl (9.7) 
< 71+ ned C0.) 


除非 在 xzy 的 各 项 之 间 产 生 了 例外 的 严重 相约 ,否则 (9.7) 右边 
第 二 项 与 第 一 项 想 比 是 可 以 忽略 不 计 的 ， 
(十 ) 在 《ii) 的 结果 中 取 》 一 *>， 则 有 
zz 一 zlrlz|。 (9.9) 
由 此 有 


Wh) 一 «rl < 2 (zzz) + 这 2 Tr) 
一 ( 2 十 a2m) (zzz)， (9.10) 
着 六 a27 < 0.1, 则 得 到 


2 十 冯 a2- < (0D < 2 人 LI1)。 


(9.11) 
所 以 ，fh(xTx) 的 相对 误差 总 是 很 小 的 。 
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Ci) 车 x 和 ?为 向 量 , * 为 数量 , 则 
A lt 6 士 -十 zayo(L 十 ca)， 

也 人 2) te) 
其 中 s 和 ei 满足 关系 式 (9.5)。 这 个 结果 可 以 表述 成 : x7y/s 的 
计算 值 是 #7y/z 的 准确 值 ， 这 里 和 3 的 元 素 与 和? 的 相 
应 元 素 的 相对 误差 为 2-” 量 级 ， 而 3 与 # 的 相对 误差 为 2 ” 量 
级 

[63) jh(AB)= 4B+F, (9.13) 


其 中 {P| <214B[+ 4) Bl (914) 


(9.12) 


平方 根 的 计算 
10. 使 用 初等 西 变换 的 各 种 方法 ,通常 不 可 避免 地 要 计算 平方 
和 根 。 自 然 , 求 平方 根 的 误差 界 在 某 种 程度 上 依赖 于 所 用 的 算法 .我 
们 不 打算 详细 讨论 这 些 算法 。 我 们 将 假定 
f(x 二 xz 避 十 8， 其 中 |s| 之 (1.00001)2-，。 (10.1) 


fx) 和 x1 十 E)， 其 中 181 < (1.00001)2- 〔10.2) 


因为 这 些 结果 在 ACE 上 都 是 正确 的 。 在 大 多 数 短 阵 算法 中 ， 求 
平方 根 的 次 数 与 其 他 运算 的 次 数 相 比 是 一 个 小 量 ， 办 此 即使 误差 
比 (10.1) 和 (10.2) 的 还 大 得 多 ,对 于 整个 误差 界 也 是 微不足道 的 。 


块 泽 点 向 量 和 矩阵 


11. 在 定点 运算 中 常常 使 用 在 某 种 程度 上 兼 育 定点 和 浮 点 的 
忧 点 的 方法 来 表示 抵 阵 和 向 基 . 
这 一 办 法 是 用 单独 一 个 2 的 村 次 形 式 的 比 们 关于 站 最 中 和 


阵 的 所 有 分 量 相 结 合 . 选择 这 一 因子 使 分 量 的 最 大 模 在 二 至 1 之 


闻 。 这 种 向 其 就 叫 作 标准 化 的 块 浮 点 向 量 。 例 如 , 在 Ga ID) 式 中 
4 是 标准 化 块 浮 点 向 量 , 4 是 标准 化 决 泽 点 短 阵 (自然 ， 为 说 明 方 
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便 ,我 们 用 了 十 进 制 的 比 鲍 因子 )。 
0.0013 


0.0002 
0.0013 
0.0067 0.2175 0.4132 
A=10| 一 0.1352 0.3145 —0.5173 |. (11.1) 
一 0.0167 一 0.0004 0.5432 
有 时 候 矩 阵 的 各 列 大 小 想 差 很 大 。 我 们 就 抬 每 一 列表 成 一 个 决 浮 
点 向 量 ， 类 似 地 也 可 以 用 浮 点 商量 来 表示 每 一 行 。 最 后 ， 每 一 行 
或 每 一 列 可 以 和 一 个 比例 因子 相 结 合 。 
这 种 方法 的 优点 是 只 需要 一 个 单元 来 存放 指数 ， 每 一 个 别 的 
元 素 可 按 全 字 长 来 存储 。 不 像 浮 点 计算 那样 耗费 若干 位 来 存储 指 
数 . 


在 计算 过 程 中 ,常常 要 计算 所 有 分 量 的 模 都 小 于 十 的 块 浮 点 


向 量 。 这 种 向 量 叫做 非 标 准 块 浮 点 向 量 。《11.2) 的 < 就 是 一 例 。 
一 0.0023 
0.0123 
8 一 10 0.0003 二 (11.2) 
一 0.0021 
有 些 情况 下 与 向 基 相 结合 的 比例 因子 是 无 关 紧要 的 ;例如 ,对 于 特 
征 向 量 就 是 这 样 。 我 们 把 比例 因子 为 ?的 标准 块 浮 点 向 量 丈 为 
规范 化 志 序 点 向 量 。 这 种 向 量 的 比例 因子 通常 都 咯 去 、 


+ 位 计算 的 基本 限制 

12. 我 们 在 第 二 章 已 指出 ， 当 撼 阵 4 需要 多 于 + 位 才能 表示 
时 ,我 们 就 不 可 能 抬 准确 的 矩阵 输入 到 上 位 字 长 的 计算 机 ， 一 开 
始 我 们 就 必须 把 矩阵 限于 “， 位 近似 ”. 

假定 暂时 认为 存 这 在 计算 机 内 的 原始 矩阵 是 准确 的 ， 或 许 我 
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们 可 以 问 自己 :采用 :位 尾数 的 浮 点 运算 (以 后 就 称 作 :位 学 点 运 
算 )， 不 管用 什么 方法 ,可 以 期 望 达到 的 最 佳 精度 是 什么 ?9 如 果 我 
们 对 4 考虑 一 种 很 简单 的 运算 ， 即 计算 变换 D 4D， 其 中 了 一 
diag(di)， 就 可 以 把 这 个 问题 腊 得 明白 些 。 著 记 


B = f(D"4D). (12.1) 
可 以 看 到 

by = drandi(l + ei), (12.2) 
其 中 le <2. 2 (12.3) 


关系 式 (12.2) 说 明 B 是 以 _ awl + 5s) 为 元 素 的 某 个 甜 阵 的 准 
确 的 相似 变换 ,因此 8 的 特征 值 是 (4 十 F) 的 特征 值 ,这 里 
(FI <2-2-44], (12.4) 
不 难 构造 鲍 子 ,使 这 个 界 几乎 达到 。 
因此 , B 的 特征 值 已 在 基 种 程度 上 偏离 了 4 的 特征 信 5。 
由 第 2 章 $ 9 知 ,对 于 孤立 的 特征 值 , 当 * 一 co 时 ， 
BO— hr~ Ex (12.5) 
其 中 yj 和 x 是 4 的 规范 化 左 和 右 特征 向 量 ， 从 (12.4) 有 
BF Fx/sl <2° 27Als/ ls S220m0 AY Is] (12.6) 


我 们 推导 出 ， 即 使 最 简单 的 相似 变换 也 给 特征 值 4 引进 误 
差 。 这 个 误差 可 以 料想 是 与 2” 和 1/1s| 成 正比 的 。 若 11sl 
大 ;特征 值 4 在 变换 中 的 伟人 误差 相应 增 大 .但 要 注意 , 如 果 原 
短 阵 本 身 不 准确 的 话 ,这 种 误差 就 已 经 产生 了 、 

当前 ,大 多 数 计算 特征 值 的 方法 包含 大 量 的 相似 变换 的 计算 ， 
每 个 都 要 比 风 才 讨论 的 简单 变换 更 复杂 。 假 定 包含 《个 这 样 的 变 
换 , 得 到 的 先 验 误差 界 不 可 能 小 于 刚才 给 出 的 误差 的 & 们 ,事实 上 ， 
倘若 变换 是 “不 稳定 的 "， 那 么 我 们 可 以 预料 到 误差 界 会 大 得 多 。 

如 果 一 个 方法 包含 站 个 相似 变换 ,又 能 证 明 最 后 的 矩阵 与 (4 
十 F) 准确 相似 ,并 且 对 于 任何 4 都 有 界 

(EL < 227%|4|, (12.7) 
则 应 把 这 样 的 方法 看 作 是 数值 十 分 稳定 的 。 但 应 强调 措 出 ， 这 样 
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的 方法 对 那些 对 应 大 的 值 1/1s| 的 特征 值 有 可 能 会 给 出 不 准确 
的 结果 。 这 种 因素 引起 的 不 准确 竹 是 不 可 如 免 的 ， 并 且 绝 不 能 看 
作 是 所 考虑 的 方法 的 缺陷 。 

读者 或 许 认 为 :我 们 此 刻 会 对 上 面 一 段 的 意见 作 点 说 明 ， 但 
是 这 里 我 们 不 想 多 作 讨 论 ， 其 余 章 节 中 的 分 析 会 使 读者 相信 结论 
的 正确 性 。 然 而 ,为 了 避免 它 对 我 们 的 观点 产生 本 质 性 的 误解 ,我 
们 作 少 许 解释 . 

13. Qi) 对 任何 a 条 件数 大 的 矩阵 并 不 意味 着 不 管 我 们 用 什 
么 方法 ,特征 值 的 精 富 损 失 都 必定 达到 《12.5) 和 (12.6) 的 办 指明 
的 量 级 。 例如, 考 灌 第 二 章 $ 33 定义 的 病态 矩阵 ， 这 个 矩阵 属于 
三 对 角 线 利 降 要 省 

qi 二 0 对 ji i 十 1 和 i 一 1， (13.1) 
则 称 4 是 三 对 角 线 矩 阵 。 现 在 我 们 讨论 一 些 针对 三 对 角 线 矩阵 的 
方法 并 且 证 明 在 这 些 方法 中 产生 的 含 人 误差 等 价 于 的 非 零 元 的 
报 动 .虽然 $33 的 矩阵 有 病态 的 特征 值 , 但 是 它们 对 于 在 三 条 对 
角 线 上 的 元 素 根本 不 敏感 。 因 此 , 尽管 1/ 1s;| 的 值 大 , 用 这 些 方 
法 对 这 样 的 矩阵 或 许 能 得 到 非常 精确 的 结果 。 

(i) 如 果 我 们 累加 内 积 或 用 fia( ) 或 所 ( ) 类 型 运算 ,那么 
虽然 我 们 可 以 认为 这 是 : 位 运算 , 但 是 我 们 实际 上 得 到 某 些 有 24 
位 正确 数字 的 结果 。 如 果 广 泛 使 用 这 种 运算 ， 我 们 可 能 得 到 更 好 
的 结果 。 

(ii) 在 上 一 节 ， 我 们 已 经 指出 某 些 变换 有 “不 稳定 ”的 可 能 
性 ， 它 意味 着 误差 可 能 十 分 大 ， 我 们 用 很 简单 的 方式 可 以 说 明 不 
稳定 性 这 个 概念 。 考虑 矩阵 4。， 

= [ 10™(0.3000) %4537 ] 
0.3563 0.5499 】 
用 4 位 浮 点 运算 , 选取 Mi 型 矩阵 (第 一 章 $40) 右 乘 do， 使 元 
素 (1, 2) 化 为 霍 。 我 们 得 到 
1 10( 一 0.1512) ]， 
0 1 


(13.2) 


-| 


“1l26n 


1 10°30.3 
0 0.3000) v | 013.3) 


AoMi 一 | 
0.3563 10(—0.5382) 
《其 中 .4M: 的 (1, 2) 元 素 已 记 为 零 ), 接 着 有 
[1 10(0.1512) 
Mi |， 1 | 


_ 10(0.5387) 10°(—0.8138) 
MIAoMs ~ | 0.3563 。 10( 一 05382) | 4 (13.4) 
办 为 计算 的 变换 后 的 矩阵 的 迹 是 0.5000, 而 原 和 矩阵 的 是 0.5502。 


所 以 , 若 


|F1 <2.107"|4,|, (13.5) 
4 就 不 能 准确 地 相似 于 任何 《如 十 P)，M: 的 很 大 的 元 素 使 得 
4 的 元 素 比 如 的 大 得 多 ,并 且 伟人 误差 不 能 等 价 于 4。 的 元 素 
的 “小 的 ” 摄 动 。 事实 上 ， 变 换 的 不 恨 后 果 比 单 从 迹 的 误差 来 人 
计 要 严重 得 多 。 按 四 位 十 进 制 来 说 ，4, 的 特征 值 是 0.7621 和 
一 0.2119, 而 4 的 是 0.2500 土 i(5.342)、 一 般 而 言 ,我 们 发 现 使 
用 有 大 元 素 的 变换 和 矩阵， 在 变动 中 产生 的 舍 人 误差 等 于 原 和 矩阵 的 
大 摄 动 . 


用 相似 变换 作 简 化 的 转 征 值 方法 


14. 继续 上 节 的 研究 ,现在 我 们 对 以 相似 变换 为 基础 的 特征 值 
方法 作 一 般 性 分 析 . 考虑 一 个 算法 ,从 抢 阵 4。 开始 ,定义 矩阵 的 
序列 4 41,-…，4, 为 

dp = He'Ar He (p= 1 5), (14.1) 
通常 ,每 一 个 4。 都 比 它 前 一 个 简单 ,但 也 并 不 总 是 这 样 .因为 By 
是 这 样 来 确定 的 ， 它 使 得 4。 中 以 前 各 步 引进 的 零 元 素 保 持 不 
变 ， 并 且 添 加 一 些 零 元 素 。 然 而 , 某 些 迭代 的 方法 ,其 序列 在 本 质 
上 是 无 穷 的 , 零 元 素 仅 仅 在 序列 的 极限 矩阵 中 出 现 。 实际 上 ,这 类 
方法 必定 收敛 得 很 快 ,在 先 代 适当 步 之 后 元 素 变 成 “ 按 运 算 精 度 是 
零 ”"。 下 面 的 分 析 适 用 于 各 种 情形 ; 如 果 方 法 是 选 代 型 的 ,那么 我 
们 所 提 到 的 零 元 素 集合 有 时 可 能 是 空 集 。 
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当然 , (14.1) 中 的 矩阵 4* 的 集合 是 按照 准确 计算 定义 的 . 实 

际 上 ,所 得 到 的 矩阵 都 有 伟人 误差 ,这 些 和 矩阵 我 们 用 46，A4，44， 
…,4 表示 .4。 有 一 个 特别 值得 指出 的 特点 ,这 就 是 , 若 设计 的 淮 

确 算法 使 每 个 4 中 六 生生 小生 下 案 个 ， 那么 在 实际 叶 守 中 ， 


ER 而 在 过 各 的 每 纱 上 自动 信 闫 为 时 

现在 ,我 们 研究 实际 计算 过 程 中 的 典型 的 一 步 ,此 时 什 阵 4p- 
已 有 了 。 这 个 算法 准确 地 应 用 于 46: 得 到 一 个 矩阵 成， 当然 
它 与 Hs 不同。 此外， 在 实际 上 我 们 得 到 的 矩阵 是 百 ,， 一 般 来 
说 它 与 不同， 因为 这 算法 用 于 4。_+ 时 有 舍 人 误差 因此 有 
三 组 短 阵 . 

(1) 满足 (14.1) 的 矩阵 Hs。 和 4。。 它 们 是 与 自 始 盏 终 准 确 
地 实现 算法 对 应 的 。 

(ii 满足 关系 

ds = (Hy Ao Hs (14.2) 

的 短 阵 到 和 4;。 其 中 已 是 对 应 于 算法 的 第 步 准确 地 应 
用 于 加 的 . 

《Ht) 实际 上 得 到 的 短 降 至 和 Zs- 

我 们 会 看 到 ,第 一 组 短 咱 在 我 们 给 出 的 误 兴 分 析 中 不 起 作用 。 
宫 有 训 效 地 去 寻 汶 “4 一 4 的 扯 、 但 是 ， 这 总 订 计 的， 表面 上 
看 起 来 ,这 似乎 不 能 令 人 相信 ,因为 可 能 认为 ,除非 4 接近 Lo， 
不 然 的 话 没有 理由 使 得 A 的 特征 信 接 近 4， 的 特征 信 。 可 是 我 
们 必须 记 住 ,我 们 并 不 实 正 关心 了 是 否 接近 4s， 而 只 要 它 准确 
地 相似 于 某 个 接近 4。 的 矩阵 。 洁 真是 这 样 那 么 每 一 个 特征 值 
的 误差 主要 依 圳 于 它 对 原始 和 矩阵 振动 的 敏感 性 。 我 们 已 经 指出 ， 
我 们 不 能 期 望 避 免 原始 抵 阵 的 病态 带 来 的 不 良 影 响 。 


苦于 初等 非 丁 变换 方法 的 误 关 分析 
15, 在 一 般 的 分 析 中 , 逢 阵 H 是 丁 给 阵 还 是 非 西 矩阵 的 研究 
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是 不 同 的 。 我们 首先 考虑 非 西 矩 阵 . 

在 第 ? 步 ， 我 们 计算 矩阵 二， 从 它 和 Tr-， 导 出 矩阵 了 
由 第 一 章 $ 40 知 ,初等 非 西 矩 阵 都 有 这 样 的 性 质 , 即 五 。 之 后 , 立 
即 能 得 到 没有 含 人 误差 的 逆 托 阵 到 *， 通常 ，4 的 元 素 分 别 为 
如 下 三 大 类 ，。 

(i) 以 前 各 步 已 消去 的 元 素 ， 它 保持 为 零 、 即 使 第 P 步 是 从 
A4 开始 准确 地 执行 , 因为 新 的 元 素 总 是 由 4,-， 的 零 元 素 的 线 
性 组 合 决定 ,因此 这 些 元 素 应 保持 为 零 。 

(i) 在 第 ? 步 算 法 要 消去 的 元 素 。 尽 管 在 计算 再。 时 的 含 人 
误差 导致 了 了 W451 对 应 的 这 些 元 素 不 是 准确 的 零 ,但 是 它们 
将 自动 地 被 赋予 去 值 。 注意 ， 根 据 定义 ，H。 是 准确 地 应 用 算法 
的 第 ? 步 于 As-: 得 到 的 和 矩 阵 ， 因 此 《HH )"146-,H; 的 这 些 元 素 
是 准确 的 零 ， 

《者 ) 由 计算 环 545- 再。 得 到 的 元 素 。 

用 关系 

As= Hr'As Ho t+ Fo 他 一 1 2 (15.1) 
定义 F*， 它 表示 我 们 得 到 的 矩阵 4 与 准确 的 乘积 :45H， 
之 疗 的 差 。 

等 式 (15.1) 可 以 组 合 为 

A Ft+tGnF G+GNF Gn 
+ + G7IFG+ GT AG,, (15.2) 
其 中 
Gr = BH 五. {15.3) 
如 果 用 等 式 
下 一 了 十 GTFG, 十 GHAF, G+ + G7IFG, 
《15.4)》 
定义 下 ， 那 么 《15.2) 变 为 

Ft+Grh4oGs 或 机 一 下 二 GildoG:。 (15.5) 
这 意味 着 也 与 如 的 一 个 准确 的 相似 变换 相差 一 个 矩阵 下 如 
果 另 外 定义 KK 为 
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开 一 GIFGT (15.6) 
那么 (15.2) 变 为 
A = GI(K+ 加)C (15.7) 
这 表示 4, 准确 地 相似 于 (4。 士 KK)， 因 而 我 们 得 到 了 在 4。 中 
与 算法 误差 等 价 的 摄 动 的 表达 式 、 从 (15.3),(15.4) 和 (15.6) 得 
到 


其 中 
工 一 HH :He, {15.9) 

我 们 说 过 , 可 以 用 II|/4o 作为 一 个 度量 来 检验 算法 的 有 
效 性 。 我 们 能 找到 这 个 比值 的 先 验 界 越 小 , 这 个 算法 就 越 有 效 . 

在 非 西 初等 变换 的 方法 中 寻求 摄 动 矩阵 & 的 一 个 真正 有 用 的 
先 验 的 界 是 极其 困难 的 。 但 是 , 等 式 (15.8) 给 我 们 一 个 重要 的 启 
示 : 用 范 数 不 大 的 初等 矩阵 是 最 合适 的 。 我 们 最 常用 第 一 章 $ 40 
的 Ms 或 Ns 型 的 矩阵 ， 从 数值 稳 定性 着 想 ， 如 果 可 能 的 话 ,我 
们 总 是 安排 算法 使 得 M。 和 N， 的 元 素 的 模 不 大 于 1. 

我 们 注意 到 ， 如 果 用 有 大 元 素 的 矩阵 及 。 作 变换 很 可 能 导致 
五 的 元 素 比 42- 的 大 得 多 。 因 此 ,在 这 一 步 的 舍 人 误差 很 可 能 
相当 大 ,由 此 产生 一 个 范 数 大 的 F, (参见 $13 的 例 )， 这 就 进 一 
步 加强 了 上 述 结论 ， 

我 们 已 经 分 别 给 出 最 后 得 到 的 计算 的 逢 阵 4, 和 初始 矩阵 
4 的 等 价 撤 动 F 和 KK 的 表达 式 .在 计算 (至 少 是 近似 地 )4: 的 特征 
系 并 且 估 计 特 征 值 的 条 件 之 后 ，F 的 界 很 可 能 是 一 个 有 用 的 后 验 
界 。 另 一 方面 , 玫 的 先 验 的 界 使 我 们 能 评价 算法 . 

现在 转 到 等 式 (15.1), 我 们 看 出 如 果 要 追踪 特征 值 的 计 
算 ， 就 必须 在 每 一 步 估计 s”， 通 常 ,对 于 每 一 个 P，sY” 是 不 周 
的 。 如 果 能 保证 特征 值 的 条 件 不 变 环 ， 那 么 我 们 就 知道 各 个 F。 
的 影响 至 多 是 相 加 的 . 


KobFLrit LaPiaL tt LFLr, (15.8) 


基于 初等 本 变换 的 方法 的 误差 分 析 
16. 一 般 而 言 ， 对 于 初等 西 变 换 的 方法 能 得 到 更 好 的 误差 界 ， 
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但 是 存在 一 个 非 商 变换 中 不 会 出 现 的 国难。 

在 第 Pp 步 ,我 们 计算 矩阵 ,， 如 果 这 一 步 没有 误差 , 它 应 该 
是 由 算法 确定 的 矩阵 45. 的 准确 的 证 变换 Hs;。 我 们 计算 了 吾 ， 
后 ， 假 定 它 确 实 是 西 和 矩阵 , 并 且 取 弄 作为 它 的 逆 。 我 们 这 样 做 
总 是 合乎 需要 的 。 而 当初 始 阵 4。 是 Hermite 矩阵 时 , 这 样 做 更 
是 必然 的 ,因为 我 们 自然 希望 4s 保持 Hermite 性 质 。 可 是 在 使 
用 公 堪 本 20- 瑟 ， 时 我 们 基于 不 溃 音 计算 -的 神似 折 。 

计算 五 ， 的 方法 应 该 是 使 得 它 给 出 的 逢 阵 接近 准确 的 西 完 
阵 , 这 一 点 是 重要 的 。 通常, 我 们 将 保证 未 十 分 接近 Hb， 它 是 
算法 第 ? 步 对 于 4 确定 的 准确 的 西 矩 阵 , 但 是 在 $ 19 中 我 们 
将 指出 只 达到 这 样 的 要 求 还 是 很 不 够 的 。 

假定 我 们 已 证 明了 

Fa = Hy + Xps {16.1) 

并 且 能 找到 Xs 的 令 人 满意 的 小 的 界 ,那么 我 们 像 在 (15.1) 那样 
用 关系 


As = BAH + Fy (16.2) 
定义 Fo， 因此 FP。 又 是 Xs。 和 准确 的 秉 积 HA- 瑞 , 之 差 。 然 
后 就 有 
Ao= (Hy + Xo A (Ho + Xp) + Fo 


= (Hy ) A sl + Ys, (16.3) 
其 中 
= (HS As Xs + (Xe) A Hs 
+ KEAp_iXs + Fs, (16.4) 
而 《BH Ap-4H， 是 4-4 的 准确 的 西 相似 变换 .对 ?从 1 到 s， 
逐次 应 用 等 式 (16.3) 我 们 得 到 
A YY GHY,AG 十 G5 .73G- 
十 .十 G8YG: 十 GoG (16.5) 
其 中 
Cr 一 下 到 (16.6) 


这 一 结果 与 (15.2) 和 《15.3) 比较 可 看 出 Bs 取代 了 Ho,Y。 取 
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代 了 Pro, 记 


不 二 了 -十 GE4doG 《16.7) 
其 中 
了 一 YY 十 GREY G, 十 GHY 2G 十 十 GyiG:。 
(16.8) 
或 者 记 
A = GH(Z + AN)G,, (16.9) 
其 中 
Ze LYLE+L AY LE + YL (16.10) 
并 且 
Ls = HiH;: Hy. (16.11) 
惠 变 换 的 优越 性 


17. Y。p 的 定义 比 $15 中 F。 的 复杂 得 多 ,等 式 (16.5) 到 
(16.11) 比 $ 15 中 的 相应 的 等 式 含有 多 得 多 的 信息 .所 有 炬 阵 Gy 
和 工 ，。 都 是 准确 的 西 短 阵 , 因而 从 酉 变换 下 2 范 数 的 不 变性 有 

lvl < Ys + ys + + + Ny:lb, (17.1) 
类 似 地 ， 因 为 Z 一 G,Y * GE， 故 有 
lzhh = 全。 (17.2) 
等 式 (16.7) 说 明 (A, 一 了 ) 是 如 的 一 个 准确 的 酉 相似 变换 。 

实际 应 用 中 ， 我 们 总 是 用 平面 旋转 或 初等 Hermite 变换 , 我 
们 发 现 不 管 是 哪 一 种 情况 对 于 (16.1) 定义 的 Xe 的 范 数 总 能 得 
到 最 满意 的 界 。 例 如 ,如 果 我 们 能 证 明 


lxsl, < a2™, (17.3) 
那么 (16.4) 给 出 
lyslh < 4p-ala(2a27 + 22 4+ fFolh, (17.4) 
并 且 从 (16.3) 得 到 
Hah < Ap + Yl < (1 + a27 PA + Fl, 
(17.5) 


Fs 是 在 计算 邢 4,8s 时 产生 的 误差 的 矩阵 ,因为 政 几 乎 是 西 矩 
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阵 、A。 与 4r-， 的 元 素 一 般 的 数量 级 相当 一 致 。 因此 实际 上 对 
志 b 寻求 形 如 
HEslhs < fp, 2 和 (17.6) 

的 界 通常 并 不 困难 ， 这 里 f(?, a) 是 和 的 某 个 简单 函数 。 从 
(17.4), (17.5),。 (17.6) 有 

Ash SL + 2 + fp, 1)2 NA, C17.7) 
和 

Yost [20 + 02°: + fp, 9)]27") .As (17.8) 
因此 对 4。 中 等 价 摄 动 Z 的 范 数 ,我 们 可 以 得 到 一 个 先 验 界 , 即 


NZ < 2 3 = (179) 
其 中 
ze = [2a + 02 十 大 Ps n)Jyp sy {17.10) 


p 
w= [Hit +Hi, 2, U71) 
Ee 


于 是 分 析 任 意 一 个 以 椒 变 换 为 基础 的 算法 简化 为 对 于 上 和 
天 p，n) 的 求 值 问题 . 


实 对 称 矩 降 


18. 当 如 是 实 矩 阵 时 ， 我 们 使 用 的 算法 将 给 出 实 的 (因此 是 
正 交 的 ) 矩 阵 Hs。 当 如 又 是 对 称 的 时 候 , 对 所 有 的 4s 我们 只 
计算 它 的 上 三 角 部 分 ,然后 利用 对 称 性 填 满 整 个 矩阵 ,这 样 矩阵 就 
保持 了 准确 的 对 称 性 .因为 (16.3) 中 的 Fw 和 Ys 分 别 表示 A 
与 (三 十 Xp)TApa(Hp 十 Xp) 和 (Hy)7A4s-4H。 之 间 的 差 , 并 
且 后 面 两 个 矩阵 都 是 准确 对 称 的 ,因而 它们 也 是 准确 地 对 称 的 .更 
在 关系 式 (17.9) 意味 着 准确 对 称 的 Z 满足 


12h < mnt | DD xe. Ga.D 


如 累计 算 的 特征 值 是 4 十 54, 十 64,.…*, 2 十 84,， 那 从 从 
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第 二 章 544 得 到 
二 < 返 2 达 zo, (18.2) 
因此 ,我 们 的 分 析 给 出 了 任何 一 个 4 关于 最 大 模 的 竺 征 值 的 祖 对 
误差 的 界 。 
我 们 的 分 析 始 终 使 用 了 2 范 数 ， 而 用 Euclid 范 数 可 以 进行 
类 羽 的 分 析 。 应 用 Widandt-Hoffman 定理 (第 二 章 $ 48) 给 出 
[52 1 < Zl. (18.3) 
我 们 强调 指出 : 通常 非 对 称 矩 阵 的 误差 分 析 并 不 比 对 称 的 来 
得 困难 .但 是 ,在 这 两 种 情况 中 关于 2 的 界 的 含义 很 不 一 样 . 


西 变换 的 限度 


19. 前 一 节 的 讨论 可 能 给 我 们 一 个 印象 : 似乎 以 西 变换 为 基 
础 的 任何 算法 必然 是 稳定 的 。 但 是 这 样 的 论断 是 很 不 正确 的 ， 我 
们 仅仅 讨论 了 由 4p-: 作 一 次 初等 本 变换 得 到 一 个 矩阵 4*， 并 
且 假 定 在 4 中 引进 的 零 元 素 也 是 这 一 个 变换 的 结果 . 我 们 指出 
过 假若 能 证 明 实际 计算 的 责 还 近 Hs ， 那 么 稳定 性 就 得 到 保 
证 ， 误 差 的 来 源 只 有 两 个 : 

0) 从 邢 4r.:Hs 计算 4 的 元 素 时 产生 的 ， 

(i) 在 4s 中 播 人 某 些 新 零 元 素 时 产生 的 . 
实际 上 总 能 证 明 第 一 个 误差 来 源 不 会 引起 麻烦 . 至 于 第 二 个 
来 源 , 情况 甚至 还 要 好 一 些 。 我 们 的 分 析 是 基于 寻求 Y* 一 4 一 
(Hy )Ap_H。 的 小 的 界 。 从 Hs。 的 定义 知 , 对 于 零 元素 ，Y。 对 
应 的 元 素 是 准确 的 零 。 可 是 ,这 个 特殊 的 处 理 方式 ,不 一 定 能 给 出 
最 强 的 界 . 如 果 我 们 能 证 明 及 。 接近 任何 准确 的 西 矩 阵 R*， 并 
对 (Rs 一 责 )》 能 得 到 好 的 界 ; 此 外 。 还 能 证 骨 在 【〔RF4r Ra) 
中 ， 对 应 4 的 零 元 位 置 上 的 元 素 是 小 的 ， 那 么 我 们 可 以 作出 类 
似 于 $6,，$17 的 分 析 。 

可 是 ,有 一 些 基于 初等 西 变换 的 算法 ,其 中 那些 关键 的 零 元 是 
在 着 于 个 北洋 的 变 煞 的 相 季 六 后 才 产 生 。 这 些 夫 元 的 出 现 通常 以 
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由 售 的 方式 依赖 于 算法 所 使 用 的 系 阵 8。 的 定义 。 

假定 从 4。 开始 ,这 些 霍 元 应 该 在 9 次 变换 之 后 的 矩阵 4 中 
出 更。 要 是 我 们 能 证 明 冬 积 瓦 瓦 … 学 接近 也 到 He， 那 么 
方法 将 是 稳定 的 。 然 而 ,即使 我 们 能 证 明 每 个 甩 , 接 近 对 应 的 H'。， 
但 这 也 没有 什么 意义 ,因为 所 ,可 能 与 三 差 得 很 远 ， 如 同 $14 
中 指出 的 那样 ,矩阵 4 和 4 可 能 完全 不 同 , 而 且 在 我 们 的 分 析 
中 ,实质 性 的 特点 是 不 做 4 和 4* 或 二 和 Hs 之 间 的 比较 . 

如 果 一 个 算法 的 成 功 与 否 主要 取决 于 与 4。 中 零 元 对 应 的 那 
些 元 素 在 A4 中 是 否 能 作为 零 元 来 接受 ， 那 么 这 些 算法 在 实用 上 
是 十 分 无 效 的 。 我 们 将 给 出 这 种 算法 严重 失败 的 例子 .。 


用 浮 点 计算 的 平面 旋转 的 误 朴 分 析 


20. 虽然 有 大 量 的 以 西 变换 为 基础 的 方法 ,但 是 只 有 儿 个 基本 
的 计算 反复 出 现 ， 为 了 以 后 使 用 方便 ,在 下 面 几 节 中 ,我 们 给 出 这 
些 计算 的 误差 分 析 。 我 们 从 标准 衬 点 运算 的 平面 旋转 开始 ， 轴 为 
这 些 运 算 最 简单 ,并 且 只 限于 讨论 实 的 情况 , 因而 涉及 的 是 正 交 抵 
阵 . 

在 很 多 算法 中 , 某 一 步 的 变换 用 下 述 方式 确定 ， 

给 定向 量 5《 通 常 是 当前 变换 徐 阵 的 一 列 或 一 行 )， 希 望 决定 
在 ti, 认 平 商 上 的 旋转 使 得 〈Rz7 一 0。 

我 们 记 


HT oe (Ks 2 {20.1) 
其 中 分 量 3。 是 标准 浮 点 数 。 由 第 一 章 $ 43 知 ,对 于 向 量 z， 算 
法 定义 的 准确 的 旋转 是 使 得 


位 = cosD， ri sin8, 


《20.2) 


rn=—sing, ri= cosd, 
其 中 
EK! + RP eos = es 
BR 十 可) 内 一 sin 一 和 
如 果 而 一 0， 那么 不 管 二 一 0 是 否 成 立 , 我 们 歌 “一 [1，: 一 0. 
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显然 。 如 果 严 格 地 按照 前 一 节 , 应 该 把 等 式 (20.2) 准确 地 定 
义 的 矩阵 称 为 R"， 因 为 它 是 用 计算 的 元 于 的 当前 值 由 算 凌 定义 
的 准确 的 矩阵 . 但 是 这 里 把 它 称 为 R， 因 为 准确 计算 得 到 的 矩阵 
不 会 在 我 们 的 讨论 中 出 现 . 为 了 简化 记号 ,我 们 去 掉 了 这 一 往 。 
实际 上 ,代替 cs 我 们 得 到 z 和 了 的 矩阵 炙 ， 其 中 
EALz/ (z+) so fz/ (a + 2. (20.3) 
5 和 5 的 计算 包括 以 下 几 步 ; 
a fl(F +), 一 太 o，< 一 有 16)， 
一 加 (本 /已 。 (20.4) 
若 厅 ~ 0 取 5 一 1，7 一 0， 在 这 种 情况 下 员 一 RR。 
为 了 说 明 序 点 分 析 方 法 的 上 应用， 我 们 详细 分 析 (20.4)。 在 以 
后 象 这 样 简单 的 应 用 ， 我 们 将 只 给 出 最 终 的 结果 .为 了 得 到 尽 可 
能 好 的 界 ,我 们 回 过 来 用 如 下 形式 的 界 
(1 -21+s<( 十 2 {20.5) 
而 不 使 用 较 简单 的 用 2- 表示 的 界 , 我 们 有 
(i) a = fi(x! +B) = + 6:) 十 于 (1 十 6) 
宇 ( 守 十 于 )(1 + 5)， 


下 


其 中 
《1 一 2 二 1 十 Bi (1 十 2 (一 1, 2, 3). 
人) 5 一 (oi) 二 ai(1 十 s0)。 由 《10,2) 知 ,其 中 
ls < (1.00001)27™, 
i) 一 HF/5) (1 + es)16, 
= (E15) sR! + 0)/b, 
lal < 2 = 5, 6). 
合并 (D，( 和 《四 ) 得 
Esc 人 (1 二 se)AL 二 aol 十 ED)， 


5 一 5(1I 十 s0A(1 十 si2(1 十 56). (20.6) 
简单 的 计算 表明 

Em cell 8), Fs(l + 868), (20.7) 

ssl < (3.003)27(i ~ 7, 8)， (20.8) 
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其 中 因子 3.003 是 极 宽 的 。 四 此， 计算 的 5 和 # 有 小 的 相对 误 

差 。 但 是 必须 强调 指出， 即使 像 刚才 分 析 的 那 祥 简单 的 计算 。 用 

浮 点 计算 并 不 一 定 能 保证 得 到 相对 误差 小 的 结果 (第 五 章 $ 12). 
我 们 可 以 记 


Em eto, f=st+8, RR+oR. {20.9) 
在 5R 中 位 于 第 i, i 行 与 第 i, i 列 交叉 点 上 的 元 素 是 
[ 的 ] 《20.10) 
一 2 pc 有 


其 他 元 素 是 零 . 因此 得 到 
HaeRl = (50 + 62) < (3.003)27, (20.11) 
HeRlle = [2(8c + 80)] < (3.003)2#27, 《20.12》 
这 证 明了 计算 的 下 接近 对 应 于 志和 避 的 准确 的 RR, 如果 给 
出 任何 两 个 浮 点 数 元 和 局 。 我 们 将 称 去 为 在 (i, 力 平面 上 的 
下 个 近似 的 族 转 ， 


用 平面 旋转 的 驰 法 


21. 现在 研究 如 下 定义 的 复合 运算 : 给 定 疯 个 浮 点 数 丈 和 多 
及 一 个 元 素 为 标准 得 点 数 的 矩阵 4， 计 算 在 (i, j) 平面 的 近似 
旋转 六 ， 然 后 计算 (下 4)。 
为 了 简化 记号 ， 我 们 首先 著 中 如 刺 e) 的 计算 ， 这 里 4 是 向 
量 。“ 只 有 在 i, f 位 置 的 两 个 元 素 被 修改 。 若 记 
b= fl(Ra), (21.1) 
则 
bp=as (pHi,) 
f(zar + io) 3 al + 6) + sa(1 + 83) 
= ia + 50) sia(l + 5) + ca(l +6) |" 
(2 til+2) (= 1,2,3,4) 
{21.2) 
此 式 可 以 表示 成 
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[Cs 


Eaiéi 十 7GjiBy 
一 ojs; 十 ze: (21.3) 
使 用 sc，s 和 si 的 界 ,并 记 
fi{(Ra) — Ref, (21.4) 


我 们 有 
ha GGe 十 5 + a + (2.0002)2™ 
* [20 + F(a + a )™ 
6 2 (0 + a) (21.5) 
这 里 因子 6 也 是 放大 的 。 注意 ,如 果 a1，a; 相对 于 某 些 其 他 分 量 
显得 很 小 ,那么 ll/llsl 就 很 小 ， 对 于 定点 计算 , 这 结论 并 不 成 
立 。 从 (21.3) 和 关系 
lz+ y+ sl lzlh + fyb + lslls, 
我 们 有 
(B+ Ea ta) +t6 2 + a 
一 (1 士 6, 2 9(e + a rn, (21.6) 
在 下 面 的 分 析 中 这 关系 是 重要 的 。 
对 (20.11) 和 (21.5) 的 研究 证 明了 误差 的 一 半 来 息 计 算 玉 


时 产生 的 训 差 , 罗 外 一 半 来 自用 计算 的 天 作 芝 汪 产生 的 误 拳 - 

当 疝 量 。 就 是 z (z; 和 困 取 自 z) 时 ,那么 实际 上 ; 通常 并 
不 计算 六 x), 而 是 令 第 i 个 分 量 为 有 [( 守 十 如 )”], 第 i 个 分 
量 为 零 ， 这 个 确定 的 第 i 个 分 量 的 表达 式 , 在 确定 时 已 经 计算 
了 . 因此 了 的 这 两 个 元 素 是 让 (于 十 界 )] 一 ( 开 十 办 ) 迪 和 
零 . 在 这 种 情况 下 ， 容 易 验证 《21.5) 的 界 是 十 分 宽 的 . 因此 测量 
= 的 特殊 处 理 不 会 产生 任何 麻烦 . 

上 述 结果 立刻 可 推广 到 凡 ( 玉 4) 的 计算 ， 其 中 4 是 a X m 
和 失 阵 .对 下 4 的 zw 个 商量 逐个 处 理 , 则 有 

N(RA)}— RA= F, 《21.7) 

此 处 除了 在 第 i 行 和 第 ; 行 之 外 , 是 零 。 并且 
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| 用 和 .2 时 十 本 二 的 十 鸭 
十 … 十 村 十 qm) 加 。 (21.8) 
注 关 ,这 是 Fle 的 办 而 不 是 Ph 的 界 .第 i 行 和 第 j 行 的 范 数 


的 平方 分 别 代替 了 我 们 对 向 基 作 分 析 中 的 a 和 9 .即使 4 的 一 
列 是 向 量 并 且 是 特殊 处 理 的 , 界 (21.8) 也 是 充分 的 . 


用 一 系列 平面 旋转 做 乘法 


22. 设 给 定 了 :对 浮 点 数 于 ,，z;。 和 算 阵 4,。 对 于 每 一 个 数 
对 我 们 可 以 计算 在 (is, js)》 平 面 上 的 一 个 近似 的 平面 旋转 R。， 
项 此 可 以 计算 :个 矩阵 , 即 

{2 一 fl(Rd0) = Rido 十 Pi， 

As — fl(RoAs 1) = RoeAsn + Fe (Pp = 2,°°, 5) 

逐次 代 人 ,由 方程 (22.1) 有 

A = QA POP: 十 … 十 9opFr nt Foe, (22.2) 
其 中 


(22.1) 


Cu = ReRr-s*** Ri 
从 定义 知道 ，R 是 准确 的 正 交 人 矩阵， 因此 0 也 是 准确 的 正 交 
矩阵 。 于 是 对 于 2 范 数 或 者 Eudid 范 数 均 有 
1 一 RoRoar "RAol SF + FL 十 + IF 
(p= 1,2,.*-, 5). (22.3) 
实际 上 ,我 们 常常 遇 到 的 是 逐次 在 平面 (1, 2), (1, 3),… 


(1 4); (2, 3), (2, 4), -+ (2, 5); (一 ls) 上 的 


了 (Ce 一 1) 个 旋转 、 现 在 我 们 汪 明 对 这 一 组 旋转 可 得 到 
Ay 一 ReRwce Rd N ~ on ~ 1). (22.4) 


的 一 个 十 分 满意 的 界 。 

23. 这 个 分 析 的 主要 困难 是 在 记号 上 .因此 ,我 们 首先 用 一 个 
向 量 代替 矩阵 do， 为 进一步 的 简化 , 我 们 取 = 一 5 〈 因 而 Y 一 
10)， 对 一 般 情况 的 证 明 是 十 分 显然 的 。 记 wo 为 初始 向 量 ,5， 
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于 ,Vw 表示 逐次 导出 的 向 量 .在 表 1 中 我 们 显 未 了 向 量 冯 的 
元 素 , 为 了 避免 多 重 下 标的 漫 乱 ,向 量 的 各 个 元 素 用 不 同 的 字母 表 
示 , 当 对 应 的 元 素 政变 时 才 改 动 其 下 标 。 一 般 在 前 〈e 一 1) 个 变 
换 中 第 一 个 元 索 每 次 要 改变 ， 以 后 不 再 变动 ， 类似 地 ， 在 其 后 的 
(* 一 2) 个 变换 中 第 二 个 元 素 被 改变 ， 以 后 不 再 涩 动 , 依 次 类 推 . 
在 表 1 中 分 别 表示 出 来 。 每 一 个 元 罕 被 改变 ” 一 1 次 ,结果 每 个 
元 索 的 下 标 最 终 都 是 《n 一 1)。 


me 忆 En 
be 所 5 
了 2 
我 们 若 记 
22 一 fl(Ry50) 二 Roop 十 加， {23.1) 
那么 我 们 上 面 的 分 析 证 明了 
lo ~ RyRy Rivoll <& hhh + Hlh + + sl 
{23.2) 


现在 , 因为 每 一 个 5。 都 是 分 量 为 浮 点 数 的 向 量 ,$ 21 的 分 析 立 即 
可 用 于 每 一 个 变换 , 记 6.2… 一 x, 我 们 有 

Mla ta) hlsx(R+ hl B+ 有 Er(3teDw 

hl < x(B—aD; Hl < z+ | 凡 二 < 入 在 二 压 )22。 

Hl & #53 + WB) 入 js x (8 + ao) 

Hi 十 于) 


(23.3) 
上 式 中 不 等 式 这 样 分 组 是 着 重 表 上 朋 其 一 般 形式 。 如 果 我 们 记 
f= t+ + lislls = x5, (23.4) 


然后 用 对 于 任何 正 数 4/ 都 成 立 的 不 等 式 
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《二 和 二 .5 
则 从 (23.3) 得 到 
《三 十 昂 ) 十 ( 刁 十 9) 十 (本 十 4 十 ( 司 士 c) 
十 ( 员 十 下 ) 十 (下 十 各 ) 十 ( 责 十 本 
十 (如 十 而 ) 十 (如 十 可 
十 (而 十 可 
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(23.6) 
对 一 般 情 况 , 式 中 因子 10 改 为 N. 
为 简明 起 见 , 记 太一 (1 十 x", 根据 N 个 变换 中 与 (21.6) 对 
应 的 关系 式 是 
H+ RSA + 6), 
如 十 下 狼 克 必 十 中 )， 严 十 且 委 多 下 十 于)， 
本 加 二 休克 二 4)， 瑞 十 下 生 臣下 十 涯 )， 避 二房 < 人 3 十 )， 
出 十 如 馆 相 忆 十 ci)， 列 十 可 委 代 列 十 列 )， 下 十 如 委 丰 司 十 村)， 
久 十 如 SX( 帮 十 可). 
(23.7) 
我 们 希望 建立 8 和 llsoj 之 闻 的 关系 .从 (23,7) 式 中 的 第 一 列 的 
关系 我 们 有 


HSA t+) 一 灵 ， 
二 的) 十 Ke —RB—d, (23.8) 
G+ 的 ) 十 电导 一 总 一 he! 一 在， 


因此 , 记 

S 一 1 十 帮 十 起 十 十 下 《23.9) 

则 (23.6) 右边 的 第 一 行 的 和 以 
Seqi 十 5 十 S30 十 3 十 Sci 一 3 有 一 351 一 3 本 (23.10) 
为 界 ， 用 呵 样 的 办 法 ,23.6) 的 其 他 三 个 行 的 和 分 别 以 下 式 为 界 

SB+ Sei + Sdi +t S12! —S0 — Sd 
| B+ SB + 3 可 —S (23.11) 
S++ Ses 

上 述 有 规则 的 形式 展示 出 在 一 般 的 情况 下 相应 的 结果 .把 (23.10) 


= 41 


和 (23.11) 中 的 式 子 相 加 ,我 们 看 到 (23.6) 等 价 于 
S43 十 5 村 Ssc3 十 Sd 二 Sed 
十 于 且 十 《本 十 过 

FD 十 全 二 本 下 《23.12) 


这 里 每 一 行 中 的 负 项 和 下 一 行 中 的 正 项 有 大 量 的 相约 。 第 一 行 完 
全 用 w 的 元 素 表示 .为 了 把 第 二 行 化 为 可 比较 的 形式 , 分别 用 已， 
心 , 和 1 乘 (23.7) 中 第 一 列 的 不 等 式 并 相 加 ,我 们 得 到 

H+ BTR +t < (Cat) + e+ ete? 


(23.13) 
因此 更 加 有 
BH) 馆 入 (十 的 十 Pei 和 有 上 
《23.14) 


类 似 地 从 (23.7) 的 第 二 列 得 到 
于 2 十 《4 下 十 如 ) SEB + 于 ) + eat ka 
(a + 5) + Rcd rt Kd + ed, (23.15) 
其 中 最 后 一 行 是 用 多 秉 (23.14) 必然 得 到 的 结果 。 类 似 地 从 
(23.7) 的 第 三 列 并 利用 (23.15) 得 到 
ha (HB) SB+ 2B) + ka 
h(a + BB) + Kei + Xd + Roe {23.16) 
(23.14), (23.15) 和 (23.16) 的 左边 括号 内 的 表达 式 是 (23.13) 的 
第 二 ,第 三 和 第 四 行 ,因此 我 们 得 到 
S10(5,08 + S10 + Secd + Sd Socd). (23.17) 
并 且 从 证 明 的 方法 可 以 看 出 ， 在 一 般 情况 下 ， 系 数 显然 是 Sn_s， 
So Sze-49 St 在 (23.17) 中 用 最 大 的 5， 代替 每 一 个 系 
数 , 我 们 当然 有 
人 105 十 局 十 0 十 者 十 02)。 《23.18) 
因此 在 一 般 情况 下 有 


Sokn 一 Do 和 


"ll. 


< Tala 一 DGa ~ 3)(1 + #2)"lolB 


(因为 5, <+ (1 十 x) 

(1 + #)" oll (23.19) 
参照 (23.2) 和 (23.4), 最 终 我 们 得 到 

ly 一 RrRw- "Rivols < oi(1 + zz 人 ml。 《23.20) 
24. 上 述 分 析 可 立刻 推广 到 同样 的 六 个 近似 旋转 自 左 妥 一 个 
(= x m) 矩阵 的 情况 . 我 们 仅 需 在 上 述 证 明 的 每 一 步 的 变换 矩阵 
中 ， 用 第 行 的 元 素 的 平方 和 代替 对 应 的 向 量 的 第 个 元 素 的 平 
方 . 对 应 于 (23.6) 的 表示 式 ， 在 大 方 括号 内 带 小 括号 的 项 仍然 只 


有 到 ae 一 D) 个 . 于 是 我 们 得 


【ar 一 RyRy “RAols < ni 十 ze 全 dolls 
一 6.2-93(1 + 6.27°)"-Aollz, (24.1) 
项 (1 十 56， 2 2“ 随 着 ”增长 以 指数 形式 趋 于 无 穷 ,但 是 这 并 不 
要 紧 。 因 为 计算 的 Aw 仅仅 在 比率 1 误差 jz/ll4ujls 小 的 情况 下 才 
有 意义 。 例 如 , 假定 我 们 要 保持 这 个 比率 低 于 10", 那么 必须 有 
6，2- 二 1 十 6。 202 < 10. (24.2) 
若 把 * 看 作 是 固定 的 ， 那 么 上 式 给 出 了 能 保证 得 到 一 个 可 接受 的 
结果 最 大 的 值 >。 显 然 我 们 应 有 6， 2-4; < 10-%， 因 此 
(1 十 6、2-92 < (1 十 10 多 -2 < exp(2 - 10-‘ni!) 
< (1 十 2 10 (24.3) 
所 以 这 个 因素 在 可 应 用 的 范围 内 是 不 重要 的 . 
(24.1) 的 右边 表示 一 个 极端 的 上 界 , 在 分 析 中 有 些 地 方 使 用 
的 不 等 式 对 和 矩阵 的 元 素 的 某 些 分 布 是 十 分 弱 的 .可 以 期 望 统计 的 
舍 人 误差 分 布 会 使 误 差 缩 减 到 低 于 我 们 的 界 的 水 平 ， 因 此 在 = 大 
的 情况 因子 用 对 代替 ni 可 能 更 为 实际 ， 
注意 ， 在 建立 界 时 ,我 们 假定 了 确定 旋转 的 如 与 和 
Ao，A。 没有 关系 ,不 管 这 些 浮 点 数 对 的 初始 情况 如 何 ， 我 们 的 结 
果 都 成 立 。 每 一 对 都 能 从 当前 的 4* 导出 或 者 从 某 个 完全 无 关 的 
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来 源 导 出 。 我们 的 比较 是 对 于 给 定数 对 的 准确 的 变换 与 计算 的 变 
换 做 的 。 如 果 每 一 对 是 取 自 当前 的 4。， 那 么 最 终 计算 的 Aw 和 
始终 用 准确 计算 应 得 到 的 矩阵 之 间 无 比较 可 敌 ， 这 里 准确 计算 包 


近似 的 平面 旋转 乘积 的 误差 


25, 到 目前 为 止 ,我 们 仅仅 讨论 了 左 委 ,还 没有 讨论 相似 变换 ， 
在 推广 我 们 的 结果 之 前 ， 我 们 要 指出 ， 这 些 单 边 变换 本 身 是 有 意 
义 的 .在 下 一 章 我 们 变 讨 论 用 左 胰 初等 正 交 甜 阵 化 方 阵 为 三 角 型 。 
$ 24 的 结果 立刻 可 应 用 到 这 个 计算 中 去 。 
在 特征 向 量 问题 中 ， 我 们 需要 计算 一 组 近似 的 平面 旋转 的 乘 
积 ,并 且 关 心计 算 的 乘积 的 正 交 性 的 偏离 。 在 《24.1) 中 , 令 4 一 
7。 我 们 得 到 
NEw 一 RwRw- :Rills < zat(1 + =2 Tle 
xm(l Tx) (25.1) 
其 中 Ps 是 计算 的 乘积 ， 和 矩阵 RyRw_s***R， 当然 是 准确 的 正 交 
和 矩阵。 如 果 分 别 用 页 和 pr 表示 Rw 和 Rw Ry.**R 的 第 i 
列 。 那 么 因为 矩阵 了 的 每 一 列 是 独立 处 理 的 ,应 用 (23.20) 得 出 
|B — pl < nd (1+) esd — snl + x (25.2) 
办 此 
1 — (+ + (+ (25.3) 
如 果 我 们 记 
P=p + qs {25.4) 
那么 
HB= (p+ qT)(pi+ qi) = qT pi + pg rt gf gis (25.5) 
IBiB1| < lg + lg + asd,ligrdls 
n+ x 2 + x + xz) (25.6) 
这 个 不 等 式 给 出 了 Ps 的 列 的 正 交 规范 化 的 偏离 的 界 , 作为 例子 ， 
设 4 一 40， ma 一 100， 则 有 
xp 一 5X2X1000<56.，10 
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因此 ,计算 100 个 近似 的 旋转 的 乘积 ,矩阵 的 正 交 性 达到 八 位 十 进 
位 。 用 统计 方法 研究 指出 , 正 交 性 大 溉 能 达到 十 位 十 进位 。 


相似 变换 的 误差 


26, 假设 B。 是 m Xx ” 和 矩阵, 用 N 个 近似 的 旋转 变换 的 转 置 
矩阵 右 薪 Bo， 对 其 显然 可 以 进行 完全 类 似 的 误差 分 析 。 事 实 上 ， 
和 如果 Bw 是 我 们 得 到 的 最 终 的 矩阵 ,那么 像 (24.1) 一 样 ,有 

| 三， 一 BeRTRI: -RXlls < sa%(1 十 zj 外 Bajle。、 (26.1) 
现在 我 们 假定 从 4。 并 始 执行 N 个 左 乘 得 到 Aw。 这 个 矩阵 的 
元 素 是 浮 点 的 , 因此 可 以 按照 式 (26.1) 中 的 B。 那样 使 用 它 并 得 
出 

NBy 一 AwRI RE .RYle < rw2(1 + = 人 we 


= ylanls, (26.2) 
也 从 (24.1) 式 ,并 用 济 一 简化 的 记号 ,我 们 得 到 
IAy 一 RyRw- “RAolle < lAolls. (26.3) 
因此 
asi < C1 + yAols. 《26.4) 
综合 上 述 结果 ,我 们 得 到 


NBw 一 RN RideRT "REls < |By 一 AwRI.. RSlls 
+ CAs Roe RA RE. .Rl 
< Avs + Ar 一 Rsw -RAolle 
+ IN Aols t WAolls 


= y(2 + lA4olls. (26.5) 
这 一 结果 表明 、 最 终 的 矩阵 与 4, 的 准确 的 相似 变换 相差 一 个 矩 
阵 ,这 个 矩阵 的 范 数 的 界 是 
6 ,， 2- 区 1 + 6: 2- ?和 2 十 
6 . 2- 和 CT + 6 ， 22 人] 4 (26.6) 


困 为 计算 的 矩阵 Bw 仅仅 当 ? 小 时 才 有 意义 ,因此 出 现在 (26.5) 
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括号 内 的 y 项 是 不 重要 的 .和 我 们 想像 的 一 样 ;相对 误差 仅仅 是 单 
边 变换 的 两 倍 。 

27. 在 某 些 算法 中 ， 左 乘 是 在 做 完 右边 的 变换 之 后 才 执 行 
的 ,但 是 这 常常 是 不 可 能 的 ,因为 决定 第 ?个 旋转 的 第 ? 对 浮 点 数 
是 从 执行 前 p 一 1 个 相似 变换 得 到 的 答 阵 中 取 的 。 

从 4。 开始 ,定义 序列 

{ Rm fi(RA), A = (XRT), 

Ro 一 fl(RoAp Te — fi(XoRE), (p= 2 N 

初 看 起 来 在 两 次 左 乘 之 间 插 入 一 次 右 乘 可 能 破坏 4 的 行 的 
东 6 数 之 间 的 特殊 关系 ， 这 种 关系 在 界 的 推导 中 是 非常 重要 的 . 我 
们 考虑 在 两 次 左 条 之 闻 插 入 一 个 准确 的 旋转 作 右 乘 的 影响 ， 这 个 
右 乘 只 作用 在 两 列 上 ， 它 保持 每 行 的 范 数 不 变 . 左 乘 中 的 误差 仅 
仅 依赖 于 发 生变 化 的 两 行 的 范 数 ， 因 此 插入 任意 多 个 准确 的 右 情 
不 影响 我 们 要 得 到 的 误差 界 。 这 就 立刻 证 明了 乘法 的 次 序 对 误差 
仅仅 有 二 阶 的 影响 。 类 似 于 $ 23 的 论证 得 出 
Aw 一 Ry "RAoRI:. -Rls < 12 ,2 

“(1 + 6 27° ye ldols, (272) 
就 因子 〈1 十 6.2")”7 而 盲 ， 这 个 结果 是 比较 弱 的 , 有 可 能 改 
善 .但 是 ,因为 只 有 12.2 -4 显著 地 小 于 1 时 计算 才 有 意义 ,因此 
这 因子 总 是 次 要 的 . 

最 后 的 这 个 结果 证 明了 在 $ 17 中 对 平面 旋转 作 的 说 明 的 正 
确 性 。 亦 即 在 实际 乘法 中 产生 的 伟人 误差 不 会 导致 数值 不 稳定 . 
为 了 概括 宽广 的 可 能 的 应 用 领域 。 我 们 已 给 出 根 当 一 般 性 的 分 
析 。 在 大 多 数 算法 中 , 逐次 变换 产生 零 元 越 来 越 多 ,因此 在 任何 特 
丈 的 应 用 中 通常 能 获得 好 一 些 的 界 。 可 是 ， 这 种 改善 通常 不 影响 
界 中 的 主要 因子 wi2-'， 而 仅仅 影响 常数 因子 。 


) (27.1) 


对 称 矩 阵 
28. 当 原 和 矩阵 是 对 称 的 , 我 们 令 所 有 4 准确 地 保持 对 称 。 因 
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为 每 次 在 i, i) 平面 执行 旋转 变换 时 ,对 角 线 以 下 的 元 素 不 是 从 
实 味 计 算得 来 ,而 是 自动 地 隋 以 和 对 胃 线 以 上 的 同样 的 值 ,因此 上 
面 的 分 析 不 能 直接 应 用 。 如 果 4。_， 是 对 称 的 ， 那 么 即使 计算 是 
用 近似 的 平面 旋转 ,除了 (i, 77 和 (i, i) 元 素 之 外 ,仍然 保持 准 
确 的 对 称 性 。 

似乎 不 能 用 任何 简单 的 方式 证 明 在 非 对 称 情况 下 得 到 的 误差 
界 能 包括 对 称 的 情况 ， 但 是 容易 证 明 多 一 个 额外 的 因 于 2+ 对 对 
称 情况 却 是 足够 的 。 其 要 点 如 下 ; 

如 果 我 们 或 是 先 用 左 腰 或 是 先 用 右 腿 来 执行 完全 的 (1, 2) 
变换 ， 那 么 误 将 矩阵 除了 在 第 1, 2 行 ,第 1, 2 列 之 外 是 零 ， 并 且 
路 了 这 两 行 两 列 的 交点 之 外 是 对 称 的 。 在 这 些 交点 上 的 误差 可 分 
列表 示 为 


Ca 


7 了 gs 


其 个 误差 给 阵 中 这 些 行列 的 其 他 元 素 是 相同 的 。 现 在 ， 如 果 我 们 
假定 它们 是 完全 对 称 的 ,那么 对 应 (28.1) 的 误差 是 
pq pr 
| zl， 小 G282) 

对 应 这 四 种 情况 的 误差 的 平方 和 分 别 是 

《iD 如 十 昱 十 天 士 呈 十 型 一 下 ， 

(i 所 十 殖 十 于 十 辣 十 束 一 和 

(省 ) 疡 十 匀 十 玫 十 十 加 一 各， 

fiv) 十 庆 了 
其 中 是 其 他 误差 的 平方 和 , 它 在 四 种 情况 下 都 是 一 样 的 . 因此 ， 
我 们 定 有 


(28.3) 


Rs Ka < 2R, (28.4) 
这 就 给 出 了 用 Eudid 范 数 时 的 因子 2 +。 显然 ， 这 个 结果 是 很 组 
的 .其 实 因子 2 全 比 23 可 能 更 符合 实际 ， 因 为 结合 左 乘 和 右 乘 
的 误差 矩阵 的 有 形式 是 
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re | om me on 


| :1B pep 
i 


四 | 。 (28.5) 


a | 
在 5 27 的 界 中 ,我 们 是 分 开 来 考虑 行 和 列 的 Euclid 范 数 的 贡献 ， 
如 果 不 是 这 样 ， 而 是 统一 考虑 它们 ， 对 元 素 p。，4，r，: 我 们 可 
能 获得 因子 2 -让 


定点 运算 的 平面 旋转 


29. 现在 我 们 转向 定点 运算 的 研究 。 因为 正 交 低 阵 的 每 个 元 
素 都 在 一 ! 到 十 1 的 范围 内 ， 并 且 变 狐 答 阵 的 范 数 都 保持 为 常数 
(除了 伟人 误差 带 来 的 小 漂移 之 外 )。 定 点 运算 不 出 现任 何 严重 的 
比例 因子 问题 。 

我 们 首先 考虑 $ 20 的 问题 .给 定 分 量 是 定点 数 的 向 量 *， 我 
们 要 决定 在 (i, 7) 平面 上 的 族 转 ,使 得 《R3); ~ 0。 我 们 假定 

E71 < 委 1 (29.1) 

在 浮 点 计算 中 ,用 〈20.2) 我 们 不 需要 任何 特殊 的 计算 技巧 就 得 到 
一 个 几乎 正 交 的 矩阵 。 但 是 在 定点 计算 中 却 不 是 这 样 。 作为 例 
子 , 假 定 


Fi = 0.000002, £7 = 0.000003, (29.2) 
并 且 用 6 位 十 进位 运算 ,我 们 得 到 
下 (富士 于 全 一 0.000004《〈 正 确 到 6 位 十 进位 ) 
于 是 
cosO 一 0.500000， sing 一 0.750000, {《29.3) 
显然 ,对 应 的 近似 平面 旋转 与 正 交 相 差 甚 远 。 


我 们 殷 述 两 个 克服 这 个 缺点 的 方法 ， 第 一 个 在 有 内 积累 加 设 
备 的 计算 机 上 是 十 分 方便 的 。 在 这 两 个 方法 中 , 如 果 不 一 0, 我 
们 就 令 cos9 一 1 和 sing 一 0， 记 
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末 一 巡 十 戏 ， (29.4) 
并 且 准 确 地 计算 8; 从 (29.1) 可 知 , 它 不 会 超过 数值 的 范围 . 现 
在 我 们 决定 好 。 这 里 玉 一 245*， 而 记 是 满足 关系 
二 <Fo2M.9nel (29.5) 
的 最 小 整数 。 最 后 我 们 用 关系 式 
S = fi([(F)4], 6 = fi(242:/2), § 一 fi(221/2) (29.6) 
计算 5 和 5。 计算 242， 和 24z; 可 以 不 包含 合 人 误差 ,我 们 得 到 


王 王 了 十 6 lal (1.0001)2-™, (29.7) 
5 和 + 一 2 + (29.8) 
lal S27 (i=2,3), (29.9) 
综合 上 述 结果 我 们 得 到 
2 一 < 十 el S=5+ gs, (29.10) 
其 中 
Br Bc/Et Ee Bs BBS/ 十 si {29.11) 


5, x; 各 吉 的 比 鲍 因子 保证 5，5 的 绝对 误差 小 ， 虽 然 其 中 某 一 
个 的 相对 误差 可 能 大 ， 如 果 我 们 记 及 一 及 二 5R， 那 么 5R 除 
了 在 第 i, i 行列 交点 之 外 是 零 ,这 些 交 点 上 的 值 是 、 
人 ] (29.12) 
一 85 6 
从 这 一 点 和 范 数 的 性 质 ,我 们 对 任何 适当 的 “都 有 
lBR < (el/Z + (B+ ed)t <71)2, (29.13) 
类 似 地 
lBR ls < (1.71)2427" < (2.42)27!, 《29.14) 


sing 和 cos0 的 另 一 种 算法 


30. 在 某 些 计算 机 上 ， 出 才 描 述 的 方法 可 能 不 是 十 分 方便 的 。 
下 面 的 方案 几乎 对 任何 计算 机 都 是 合适 的 。 因 为 
Sos0 一 /( 守 十 守 )，sin0 一/ 加 十 守 )。 (30.1) 
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如 果 记 


Bi mm, Kf fy {30.2) 
则 有 oos0 = mf(m' + 1 = 1 (m+ DP, (30.3) 
sin0 = /m+ DP n/n + DY (30.4) 


我 们 可 以 按照 |m1 是 否 小 于 1 去 使 用 含有 mm 或 * 的 表达 式 。 为 
了 保持 所 有 数 在 允许 范 黑 内 ,《30.3) 和 《30.4) 可 以 写成 


=—t/ (tt i) , (30.5) 


-十 / (t e+ 二 (30.6) 
应 用 这 个 方法 也 给 出 绝对 误差 小 的 值 = 和 下 


用 近似 的 定点 族 转 左 系 


31.$ 21 讨论 的 运算 用 定点 计算 就 比较 简单 ,并 且 不 必 预 先 研 
究 向 量 乘法 ,而 是 直接 估计 万 (4) 一 RA 一 ,我们 有 
F=fi(RA)— RA— fi(RA)— RA+ RA— RA 

一 FA 一 一 -RA + 8RA. (31.1) 


(§ 32) 再来 检验 这 个 假定 的 意义 ， 
在 左 乘 中 仅仅 修改 第 of 行 ， 因此 除了 这 些 行 之 外 ,fi(RA) 
一 瓦 4 全 是 零 。 如 果 假 定 我 们 用 后 ( ) 运算 ,那么 我 们 有 
[folRA)a 一 纺 (zei + San) = om 十 Sa + sms (31.2) 
[a(RAID 一 所 (一 到 十 Eart) = 一 Si 十 Cait + eik» 
(31.3) 
Let， lei S27 Ci soos 1), (31.4) 
对 于 fi( ) 运 算 , 误 差 界 增 大 到 两 倍 ， 关 系 (31.2) 至 (31.4) 表明 
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改 们 可 以 写 
fi,(RA) — RA= 6G, (31.5) 
其 中 CG 在 第 i, f 行 元 素 的 模拟 2“! 为 界 ,其 他 元 索 爹 是 零 。 因 
此 我 们 得 到 
leh 和 由 cl 么 2 一 (22 和 (31.6) 
1Glz & 27"(2)t, (31.7) 
逢 (31.1) 和 (29.13) 给 出 
lelh = Ni(RA) — RA < lols + MeRlslal 
S29) + (1.71)27, (31.8) 
注 兽 乘法 产生 的 误差 的 影响 使 界 舍 有 因子 ef， 但 是 下 与 的 偏 
差 产生 的 影响 是 与 ?无关 的 。 在 浮 点 计算 中 这 两 种 影响 几乎 完全 
相等 并 且 都 与 ? 无 关 , 也 应 注意 ,即使 第 i, i 行 的 元 素 比 14 业 小 ， 
我 们 也 得 不 到 更 好 的 界 。 这 个 结果 与 浮 点 计算 得 到 的 结果 不 同 . 
如 果 确 定 旋转 的 页 和 五 分 别 是 2-: 的 第 i, i 行 的 某 列 
上 的 元 案 ， 那 么 通常 我 们 不 必 像 用 (31.2) 和 (31.3) 那样 去 计算 
这 两 个 元 素 的 新 值 ， 而 是 插入 值 大 (2-*3) 《网 $29) 和 堆 。 不 难 
看 出 ， 这 是 无 关 紧要 的 .在 R4 中 对 应 的 两 个 元 素 分 别 是 2 45 
和 零 , 因 此 在 这 些 位置 上 的 误差 是 
及 (2 二) 一 243 和 零 。 


并 且 我 们 得 到 
有 2- 二 ) 一 2 可 一 2 二 6 一 2 名 (sl < 2), 
从 而 有 
Ni(2742) — 2-t35| 委 2 村 有 一 中 十 el 


< 2 人 1+2-9 < 和 2 (31.9) 
虽然 ,我 们 仅 需 把 (31.8) 中 的 1.71 改写 2.21， 因 此 只 要 取 
lr 2 (20) + (C2. 21)27, (31.10) 
这 特例 就 包括 在 内 了 。 


用 一 系列 平面 旋转 相当 (定点 ) 
32. 现在 考虑 522 的 问题 的 定点 处 理 。 与 方程 (22.1) 和 
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(22.2) 类 似 地 有 
= a(RA) = Rdot F, 


DolReds) = ReAos + Fe pm 2 032 
和 
A Odot QFit + QoFont Fe (32.2) 
其 中 
RPRo -Ri (32.3) 
因此 
As 一 RoReae Ridolh SF + 32.4) 
如 果 对 于 所 有 变换 都 假设 ii4 小 去 1， 那 么 上 一 节 的 分 析 表 
明 
Pi < [(2o) 十 4.42]2- 生 一 x, (32.5) 
因此 ， 
lA 一 ReRe-e Ri < px. (32.6) 
从 而 有 
1 中 14olb + px。 (32.7) 
现在 我 们 可 以 验证 ， 如果 考虑 * 个 变换 ， 那 么 只 要 
Ta <1 一 sz (32.8) 
训 有 
As <1 (p01, 5). 《32.9) 
对 于 $ 22 讨论 的 N 个 变换 ,最 终 的 结果 是 
lay 一 RnRw Ridolh < Nr ~ iat (32.10) 
但 是 de。 标 引 人 适当 的 比例 因子 ,使 得 
ld 由 < 1 一 Nzx (32.11) 
满足 。 


33. 因为 我 们 仅仅 对 于 小 的 Nx 的 结果 感 兴趣 ,因此 ,初始 比例 
因子 的 要 求实 际 上 并 不 比 无 伟人 误差 时 必需 的 比例 因子 的 要 求 更 
黄 记 ,但 是 ,(32.11) 的 要 求 是 不 实用 的 。 因为 j4o 的 计算 与 
4。 的 特征 值 的 计算 是 泣 样 的 困难 。 另 一 方面 ,我 们 有 

Bal < |All (33.1) 
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因此 , 若 对 于 fi4olls 下 式 成 立 
ldols < 1 一 Mr (33.2) 
那么 对 于 14。 自然 也 成 立 ,但 4olls 容易 计算 .如 果 初 始 的 比 
例 因 子 使 《33.2) 满足 ,我 们 能 同样 证 明 
有 iv 一 RwRw- Ridolz < Ny, (33.3) 


其 中 

y= [(2a)t + 5.84]2-":, (33.4) 
因为 当 * 大 时 ，x 和 ? 几乎 相等 ， 如 果 46 已 引信 比例 因子 使 
《33,2) 满足 ,那么 (33.3) 是 比较 精密 的 结果 。 


一 组 近 仆 平面 旋转 的 计算 荣 积 


34. 像 5 25 一样 ,我 们 可 以 把 这 个 结果 应 用 于 一 系列 近似 平面 
旋转 的 柔 积 的 计算 上 . 但 是 ,我 们 在 (32.10) 中 不 能 令 4 一 1, 因 


为 这 样 作 (32.11) 就 不 满足 了 。 如 果 我 们 令 4, 一 二 1， 那么 对 


任何 使 乘积 有 实用 意义 的 ra,(32.11) 都 满足 。 设 了 是 最 终 计 
算 的 矩阵 ,我 们 有 


I ~ 到 RuRw Rb < Ne, {34.1) 
2 一 RsRw Ri < 2Nzx, (34.2) 
并 且 误差 的 量 级 仍然 是 a+。 


相似 变换 的 误 整 
35. 我 们 的 分 析 直 接 提供 了 WN 个 相似 变换 序列 产生 的 误差 的 
界 . 事实 上 ， 如 果 我 们 计算 fi(RyRy_1. "RR,AoRIY .RR )， 
不 管 滋 法 的 次 序 如 何 , 我 们 都 有 
一 Ry RdoRE RN < 2Vx， {35.1) 
只 要 下 式 得 到 满足 
ld < 1 — 2Nz, (35.2) 
可 是 ， 决定 政 , 的 一 对 数 常常 是 4r-' 的 元 素 ,这 时 候 .执行 计算 
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的 次 序 是 
R= fi(RAo), 4 = f(TRT), 
Ko 一 fol(RrAr_), Av 一 成 (和 二) (p= 2,°", N). 
(35.3) 
在 这 种 情况 下 ,成 对 地 考虑 左 冬 和 右 胰 是 有 好 处 的 。 我 们 定义 
Ho 为 
Hy 一 了 — RoAo aR? 一 fh(RoAdo RE) — Ro ApiRE, 
(35.4) 
因此 
A — RoAs RE = Hs RoAdo RY 一 Rock 
— Hy + BR,As RY + ReAs BRE + RrAp RY, 
(35.5) 
于 是 有 


4s 一 ReAp sRE lb < UHolht (213R oat aRoila) A 

< NE + (3.43)27" A (35.6) 
这 个 结果 中 (3.43)2- 取 代 了 [2(1.71)2 一 十 《1.71)22]。 假定 
对 所 有 的 p， 和 4 之 1， 那么 我 们 有 


IAs 一 Rue * RAoRE :RE < DH + NC3.43)2™. 
1 


(35.7) 
其 中 Hs 是 利用 及 有 4,RF 计算 4 时 实际 产生 的 误差 矩 
阵 。 结 果 旋 转 是 在 (i, 让 平面 上 ， 那么 变换 的 影响 仅仅 是 第 i, j 
行 、 列 ， 因 此 在 Hs 的 其 他 位 置 上 是 零 。 除 了 在 4 个 交点 上 的 元 
过 之 外 , 左 乘 仅 仅 影响 第 i, f 行 , 右 习 仅 仅 影 响 第 i, 7 列 .因此 ， 

对 所 有 不 蕊 i, f 得 到 

(Ha 及 (2 十 BE) 一 Gige 一 Ai Eig 
(len| <2°"), (35.8) 
类 似 地 

lH, (Hwl, (CHA! < 20, (35.9) 
在 交点 上 的 四 个 元 素 左 策 和 右 乘 时 都 要 改变 . 现在 我 们 来 详 
细 地 研究 一 下 。 假 定 先 作 左 乘 。 在 这 四 个 位 置 上 左 乘 产生 的 误 壮 
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并 不 比 在 i,i 行 其 余 的 位 置 上 产生 的 误差 特殊 。 因此 ， 计 算 的 
值 可 以 表示 为 
4 十 Bif B+ es 1-[ A 
Cisen D+es 5 万 上 
其 中 4, B，C， D 是 用 玉 。 作 准确 的 左 乘 所 得 。 因此 右 乘 之 后 
得 到 的 信 表 示 为 


{35.10) 


[ 4+ Bt 一 人 二， (35.11) 
GF Bt mm 0+ Dt a 
其 中 每 一 个 mr 满足 

I! S27 (35.12) 
如 果 我 们 用 

2 和 [， 1 (35.13) 


表示 在 这 些 位 置 上 这 两 种 运算 《 即 中 ,45.,R3 ) 产生 的 误差 , 则 有 
2 ig = ey + Bs + iis 
2 em 和 | + lelis) + az 
< (B+ ei) (B+ FP + Ml 
< (2.42) 27 {35.14) 
显然 同样 的 界 对 于 8, 7, 8 也 是 适当 的 。 因 此 ,对 于 ”一 6，i 一 
2， 7 一 4 这 个 典型 的 情况 ,我 们 得 到 


0 1 0 1 0o0 

1 242 1 242 1 1 

0 1 0o 1 0 0 
la 2 74 1242 1 (35.15) 

0 1 0 1 00 

‘010 1 00 

用 其 中 的 元 素 1 组 成 的 对 称 和 矩阵 的 特征 方程 是 

jz 一 2(z 一 2 一 0 (35.16) 


因此 , 它 的 2 范 数 是 (25 一 4)*， 其 余 的 四 个 元 素 构 成 的 矩阵 的 
2 范 数 不 大 于 (4.84)2 一 “综合 这 些 结果 我 们 得 到 


155。 


Hzlls < [C2n — 4) + 4.84]2-1 (35.17) 
因此 ,从 (35.7) 得 到 
IAy 一 Rye "RiAoRT :RY < 2 全 
* [(2n — 4)® + 11.70]N. (35,18) 
当然 ,相应 的 初始 比例 因子 要 求 应 是 
aol < 1— 2 "(C25 ~ 4)# + 11.70]N, (35.19) 


关于 误 亲 界 的 总 评述 


36. 我 们 刚才 得 到 的 定点 界 没有 出 现 浮 点 界 中 含有 的 指数 因 
子 。 但 是 这 一 点 差别 是 迷 感 人 和 的， 我 们 应 当 记 住 ,这 个 界 只 是 在 
《35.19) 满足 时 才 成 立 的 。 若 * 太 大 ， 这 个 条 件 就 不 能 满足 ,因为 
它 意 昧 着 14o 了 b 必定 是 负 的 ， 在 有 效 的 范围 内 ,结果 实质 上 是 : 
{Ay 一 Ry RART Re < hn dols ( 浮 点 ), (36.1) 
An 一 Rw +* RAoRT REN, < ni27 4ol， 《定点 )，(36.2) 
A 一 Rye** RiAoRT. .+ REls < Koni2"" Aolls (定点 ). (36.3) 
无 疑 对 于 较 大 的 x， 浮 点 的 结果 显然 比较 优越 . 
值得 提出 的 是 ;对 于 一 般 的 矩阵 4,， 在 定点 的 结果 中 , 因 
子 对 2 的 改善 是 不 大 可 能 的 . 事实 上 ,我 们 考察 一 个 假设 的 斌 
验 。 其 中 的 矩阵 45(p 一 1,…, NN) 是 这 样 计算 的 。 在 第 Pp 步 ， 
用 无 穷 位 数 准确 地 计算 矩阵 R 和 RrAs-1RY; 然 慑 把 R46,RP 
的 元 素 含 人 为 标准 定点 数 ,所 得 的 矩阵 为 4z。 显 然 ,我 们 有 
一 Rodp_iRFI + H;, (36.4) 
其 中 [Hs| 对 于 # 一 6, i 一 2，i 一 4 的 情况 ,以 阵列 
ro 1 0 0 


- 


2 {36.5) 


mn nn pp -= 
oem om 
ED ° 
ooror 


11 
1 0 
1 1 
1 0 
1 0 
为 界 .( 这 里 假定 ,在 一 般 情况 下 , 变 
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换 时 4 中 没有 引进 零 元 . ) 像 


$35 一 样 可 推出 ， 对 于 这 个 试验 所 得 到 的 了 w 一 RRw…RiLdoRT… 
RB| 的 界 中 有 因子 mi2- 

我 们 有 时 用 霹 ( ) 代替 及 )。 这 对 最 终 的 界 没有 什么 影 
响 .如 果 始 终 用 大 ( )， 最 多 不 过 是 再 加 个 因 于 2、 在 浮 点 分 析 中 
我 们 始终 是 用 ji( ), 但 是 因为 在 整个 计算 中 没有 出 现 高 阶 内 积 ， 
因而 不 产生 本 质 的 差别 。 


泽 点 计算 的 初等 Hermite 矩阵 


37. 现在 我 们 转向 使 用 初等 Hermite 矩阵 (第 一 章 , $45, 46). 
给 出 所 ), 隔 ( ),。 天 ) 和 天 ( ) 的 每 一 种 情况 的 分 析 是 不 
实际 的 . 我 们 已 经 选择 了 fh( ) 模式 ,因为 它 特别 有 效 , 并 且 我 们 
在 别 的 地 方 已 给 出 了 另 一 模式 的 分 析 ， 例 如， 参见 Wilkinson 
(1961b) 和 (1962b)。 在 有 关 的 算法 中 出 瑰 的 最 一 般 情况 如 下 。 

给 定 有 ?= 个 浮 点 分 量 的 向 量 *， 要 决定 一 个 初等 Hermite 答 
阵 P, 使 得 用 它 左 乘 后 * 的 前 + 个 分 量 保持 不 变 , 而 消去 第 r 十 2， 
r 十 3,'…,# 分 量 . 假定 x 是 实 的 ,并 且 我 们 先 给 出 没有 舍 人 误 


差 的 有 关 的 数学 分 析 。 
若 记 
wi (0 0 wr" wa) (37.1) 
= (0: v7), (37.2) 
其 中 > 是 有 (= 一 >) 个 分 量 的 向 量 , 那 么 我 们 有 
[| 
PI—2wwr= | . {37.3) 
Di7 一 2zz7 
(一 ?pzT7) 是 (na 一 ”) 阶 初等 Hermite 矩阵 ,因为 
vy = wiw 一 1。 (37.4) 
按 P 划 分 x*r7， 于 是 
Te (y, 21), (37.5) 


我 们 得 到 


y y 
| | | - [a -| (37.6) 
3 (IT — 2vvT)# 
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因此 ,我 们 只 需 选 取 ” 使 得 〔〈7 一 2zv7)z 除了 第 一 个 分 量 外 全 为 


零 


38, 显然 ,有 参数 的 7 和 # 的 原 问 题 本 质 上 等 价 于 有 参数 0 和 


# 一 + 的 较 简 单 的 问题 因此， 我 们 现在 考虑 下 述 问 题 是 很 有 普 
过 意义 的 , 综 罕 维 向 基 =。 构造 一 个 儿 千 Hemmie 类 旗 , 信 得 


Pr ke, 
因为 2 范 数 不 变 ,因此 , 若 记 
一 寻 十 十， 
则 有 
大 一 +S, 


红外 ,等 式 (38.1) 给 出 
A wi(wir) = +5, 


ti — 2wi(wIs) = 0. 


因此 ， 
2Kwn = tTS, ZKwi = x (f= 2,.+, a), 

其 中 

天 一 rz。 
(38.6) 各 个 等 式 平方 , 相 加 然后 用 2 除 ,我 们 得 到 

2 本 一 SFxd, 
我 们 如 果 记 
机 一 (ra 于 S zx 0) 

那么 

比 一 2 2 
并 且 


P= 1 — wu/2K. 
在 整个 过 程 中 仅仅 需要 一 个 从 了 产生 5 的 平方 运算 


初等 Hermite 矩阵 计算 的 误 束 分 析 


(38.1) 
(38,2) 
(38.3) 


(38.4) 
(38.5) 


(38.6) 
(38.7) 
(38.8) 
{38.9) 
(38,10) 


(38.11) 


39. 现在 假定 * 的 分 量 是 浮 点 数 ， 并 且 用 到 ( ) 计算 导出 矩 
阵 了 。 我 们 希望 找到 || 了 一 中 的 界 , 其 中 了 是 对 应 给 定 的 * 的 准 
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确 的 和 矩阵， 在 这 个 比较 中 因为 > 看 作 准 确 的 向 县 ， 我 们 省 去 它 的 
分 量 上 面 的 一 杠 。 
在 $38 的 等 式 中 , 有 一 个 符号 待 选择 我 们 发 现 为 了 使 数值 


稳定 ,这 个 符号 的 正确 选择 是 使 得 
2 SFnS = 5+ [|S， (39.1) 
于 是 在 形成 2K? 时 不 发 生 相约 。 因 此 ,如 果 * 是 正 的 ,我 们 取 
2K = $+ 8, (39.2) 
w= (n+ 5, ws, ta), (39.3) 
不 失 一 般 性 ， 取 x 为 正 ; 只 要 采用 这 种 稳定 的 选择 ,误差 的 界 与 
如 的 符号 无 关 。 
计算 步 又 如 下 : 
(i) 计算 童 e, 其 中 
4 一 用 (对 十 好 十 十 翅 ). (39.4)》 


数 . 因此 ， 


2 ss) 十 十 歼 (1 二 en) (39.5) 
从 (9.4) 和 (9.5) 我 们 更 加 有 
le < 三 2 (39.6) 
因此 
4 十 对 二 十 成) (1+ 8) = 59(1 +8) 
(lst < 02”). (39.7) 


(it) 从 a 计算 3, 这 里 从 (10.2) 得 到 
5= f(at) = a +) < (1.00001)27). (39.8) 
因此 


B= 5(1+ eo)t(1+9) = 5(1 + 5). (39.9) 
从 (39.7) 和 (39.8) 自然 得 到 
§ < (1.00002)27™, (39.10) 


(ii) 计算 2 开 ， 其 中 
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2 瑟 一 扰 妇 十 功 十 十 克 十 xz3) 
二 [3(1 二 人) 十 1 十 史 ) 十 十 到 (1 二 9) 
+ a5(1 + gr)](1 + 8). (39.11) 
从 (9.4) 和 (9.5) 我 们 自然 有 


四 < 于 Da, le < 27 (39.12) 
在 2 的 计算 中 大 多 数 累 加 已 在 (i) 中 做 完 。 


综合 上 述 结果 并 注意 到 = 是 正 的 ,我 们 得 到 
2 站 二 (有 十 对 十 一 二 蕊 十 (1 十 5)(1 + 6) 


(< 三 + Da) 


下 [3 二 zS(1IT+TS)ICLTIDCITE)。 (39.13) 
如 果 我 们 记 
sl+ = Pi a) te), (39.14) 
则 有 
“一 (ss) 所 (39.15) 
因为 ms 和 3 都 是 正 数 并 且 二 5 这 给 出 
1 么 去 导 | (39.16) 


如 果 *% 是 负 的 ,我 们 必定 取 5 一 tS， 使 得 相对 误差 小 .我们 的 
符号 选择 法 仍然 是 有 效 的 .因此 ,我 们 必定 有 
2 本 = 2K°(1 + 0) (18| < (1.501)2"). (39,17) 
(iv) 最 后 ,我 们 计算 #。# 只 有 第 一 个 元 素 需 要 计算 , 并 且 
rnt+ 5) n+ D+ $) ($1 27) (39.18) 
[x SC + E11 TF $). (39.19) 
我 们 的 符号 选择 方法 仍然 保证 相对 误差 小 ,并 且 我 们 必然 得 到 
(tS)I+t G) (ipl < 1501)27) (39.20) 
Wu(l+ 9). (39.21) 
我 们 可 记 
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UT a (hy Way ty ta) uu 《39.22) 
其 中 
Naulh = legl <(450172-4e 和 3 (39.23) 
因此 ， 
zh = lx + ul < [1 + C1.501)27 "I, (39.24) 
40. 如 果 我 们 愿意 保留 了 的 下 述 办 子 形式 
B 1 — ux/2R’. (40.1) 
那么 , P 是 能 得 到 的 ,并 且 这 种 形式 常常 是 最 方便 的 , 只 有 用 了 作 
为 老子 才 会 带 来 额外 的 含 人 误差 而 这 要 单独 作 分 析 。 从 〈40.1)， 
我 们 有 
FP 一 PP wuT/2K2 一 2712 到 
= (wuT 一 5857)A2K2 十 ET(1A2K2 — 1/2F). (40.2) 
因为 wsT72K? 一 2， 用 (39.17)，(〈39.23) 和 《39.24) 作 一 个 简 
单 计算 证 明 必定 有 
IB ~ Ph < (9.01)2™. (40.3) 
注意 这 个 界 与 无关， 因为 P 与 《za 一 1) 个 平面 旋转 的 效果 相 
同 。 所 以 ,这 是 令 人 十 分 满意 的 . 
在 某 些 应 用 中 ,对 了 再 作 一 点 加 工 是 方便 的 , 亦 即 先 由 


DT = HRT/2K’) (40.4) 
计算 向 量 5, 然后 
Pel — uvl, (40,5) 
从 (40.4)， 
=(a/2K La) 《le < 27), (40.6) 
因此 ， 
=u/2R 十 6v, {40.7) 
其 中 
Havll < 27lal/2R, (040.8) 
这 样 计算 了 , 我 们 必定 有 
lB 一 到 < 011.02)27, {40.9) 


因为 对 任何 向 量 * 和 5, ab"; 一 ztzllg。 所 以 在 上 述 的 界 中 ， 
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我 们 可 以 用 Eudid 范 数 代替 2 范 数 。 
现在 回 到 仅仅 希望 改变 最 后 (n 一 >) 个 分 量 的 情况 ,我 们 
得 到 了 一 个 形 奶 
[本 
olF 


的 矩阵 ,其 中 巨 是 (a 一 +) 阶 矩 阵 。 但 是 要 记 住 ， 我 们 的 误差 的 
界 与 ?无 关 。 


数值 例子 


币 , 下 述 简单 的 数值 例 子 说 明正 确 选 择 符号 韵 重 要 人 性。 假定 
询 量 * 给 定 为 
x = [10°(0.5123), 1073(0.6147), 10-:(0.5135)}. 
我 们 用 记 ( ”) 按照 四 位 十 进位 运算 得 到 
a 一 fri+ x) = 10%(0.26245193), 
§ ~ fat) = 10%0.5123)。 
并 且 用 稳定 的 符号 选择 方法 得 到 
2K 有 十 对 十 用 十 5) 一 10(0.5249)3 
falri + §) = 10(0.1025); 
HT wm [10:(0.1025), 1073(0.6147), 10-:(0.5135)], 
用 这 符号 选择 靶 ， 修 正 "的 值 是 
S 一 10°(0.5123006261...); 2K? 一 10°(0.5249035...); 
aT = [10'(0.10246006...), 1073(0.6147), 10-3(0.5135)], 
可 以 验证 , 上 面 带 一 杠 的 值 满足 $ 39 中 的 不 等 式 .这 里 我 们 按照 


4 位 十 进位 计算 以 二 10' 代 共 了 2， 用 不 稳定 的 符号 进 择 法 ,我 
们 得 到 
2 有 一 h(n + 10 "(0.6400); 
= h(x — $) = 10°(0.0000); 
7 = [10°(0.0000), 10™3(0.6147), 10- 0.5135)1, 
用 这 样 的 符号 选择 法 得 到 的 “修正 ”的 信和 是 
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2K: 一 10-5(0,3207...)} 
uT = [10-5(0.6261), 1073(0.6147), 10™(0.5135)]. 
容易 验证 , 在 这 种 情况 下 ，FP 一 7 一 z47/2 放 甚至 不 是 接近 正 交 
的 ,因此 它 不 逼近 P， 计 算 秆 2 必 的 相对 误差 很 大 。 


用 近似 的 初等 Hermite 矩阵 左 生 
42. 类 似 于 平面 旋转 的 研究 ,现在 我 们 寻求 关于 


了 | O Iio 
a 
Di 
的 界 。 因 然 这 个 左 乘 保持 4 的 前 7 行 不 变 , 而 后 (n 一 r+) 行 被 
P 左 小 (或 被 有 合 人 误差 的 了 左 乘 )。 因此 (42.1) 的 误差 矩阵 的 
前 + 行 是 零 ， 我们 考 虚 用 P 左 乘 一 个 m 行 5 列 矩 阵 4 就 能 代表 一 
散 情形 ,此 时 P 是 相应 于 m 维 非 零 向 量 ww 的 。 
令 了 是 因子 形式 《1 一 #712K*)， 它 使 得 5 39 的 不 等 式 和 
(40.3) 满足 ， 我 们 得 出 
(BA)— PA=fh(BA)— BA+ BA—PA, (42.2) 
(PBA) — PAlls < lfh( BA) — BAlls + KF ~ P)Ails 
< (FA) — PAls + (9.01)2™"A Ns. 《42.3) 
因此 ， 我 们 要 找 亿 (z4) 一 了 4 的 界 ,这 个 失 阵 是 左 彝 实际 产生 
的 误差 的 矩阵 。 注意，(9.14) 给 出 的 误差 界 不 适用 于 所 (FE4) 的 
计算 ;因为 为 了 节省 运算 县, 忆 用 了 因子 的 形式 ， 
为 了 强调 我 们 现在 只 关心 左 冬 造成 的 误差 ,我 们 引进 7 和 对 ， 
y= #, M = 2R, 《42.4) 


4 (42.1) 


于 是 


互 一 [一 ?7AM， (42.5) 
且 
yAM 一 上 和 /2 
< ellBll + C1.501)27"P/2K°1 — (1.501)2™"] 
< 21+ (4.51)27], (42.6) 
43. 54 的 准确 推导 和 人 (4) 的 计算 的 步骤 可 表达 如 下 ， 
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准确 的 计算 的 
pr yAIM, Fr oy AIM), 
一 B4 一 4 一 95 B=ih(PA)=fh(4—y5!). 
因此 ,第 i 个 分 量 声 是 
B= [yavl t+ 6) + par(1+ 6) 
十 -… 十 jam(l 十 gu)](i 十 s)AM， 
这 里 从 (9.2) 和 (9.5) 我 们 更 加 有 


ls] < Cm + 1)2%, jel < 2 
因此 
B=p(lt e) tg, 
其 中 
la < 二 (mn + Dal + 27) 
[yllevl+t ly loslt. + ysl em ll/M. 
从 而 有 
声 一 P27 pl 十 三 (m 十 1)2-2 
“(1+ 22°4171y[ DM. 
所 以 ,我 们 有 


师 一 让 壬 2 入 十 三 (m + 1)2-2 


“1+ 2 jy 和 ldlleAM 。 
引用 条 件 (5.2), 即 2 < 0.1， 我 们 可 有 
WF—plh < 2pih + C0.16)27 "yl lA le/ M. 
对 各 的 (i, 1) 分 量 ,我 们 有 
By =o(4 — yp 


(43.1) 
(43.2) 


(43.3) 


(43.4) 


(43.5) 


(43.6) 


(43.7) 


{43.8) 


(43.9) 


Ss onl tm) ~ yAl + mm) HL + §), (43.10) 


3 ,-. 
I bl F227 


如 果 用 关系 
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(43.11) 


ppt+ 538 (43.12) 
定义 3， 那么 
Bi Lasl +t mn) — ylpit+ Bp)(T Tn) + £) 
= bi(l+§)+ [om— yp — yop lt (1+E), 


(43.13) 
因此 ，、 
上面 一 好 | < 27 snl 
十 仁 2lol 十 立 21zlal 
+ 19 laaif 1 十 三 ?9]] (二 29， (43.14) 
这 给 出 
[8 ~ BIS27|B] 
3 3 J 
+ zl + pa 多 全 
3 2 - 
十 tylleph(1 + 22 )] (1 + 27), (43.15) 
由 此 导出 
BBls <2Bils 
十 全 344 有 十 二 2 
+ yloph(1 + 2 G42, (043 
44. 现在 我 们 利用 $4lls 求 右 边 的 每 一 项 的 界 。 从 (43.1) 和 
(40.3) 我 们 得 到 
lBlle = NE4le < JPAlls + lB — P)Als 


< lAls + C9.01)27°Als. (44.1) 
从 (43.1) 和 (42.6) 得 到 
中 lp < 二 EM < 21A Ral + (4.51)2™]. (44.2) 
从 (43.9) 和 (42.6) 得 到 
jp 起 458 和 < lylt2™ el + C0.16)2™ ylblA a/ 34 ] 
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安 2《244Ia[1 十 (4.51)2 十 (0.32)14jeft 


+ (4.51)271} < (2.33)2 4. (44.3) 
综合 上 述 结果 我 们 必定 有 
NB — Bl < (3.35)2™"|A lls. (44.4) 


而 六 一 B 一 和 (了 4) 一 4， 则 (42.3) 变 为 
Wi BA) — pAlls < (3.35)27"]Alls + (9.01)27|4 ls 
到 {12.36)2™|4 lz. (44.5) 
回 到 一 般 情 况 , 我 们 立刻 有 


-| 
< (12.36)27]A ,ls 

< (12.36)2714ils, 《44.6》 
其 中 4,- 是 4 的 后 (= 一 +) 行 构成 的 矩阵 。 在 4 的 一 列 是 用 
来 确定 了 的 向 量 * 这 种 特殊 情况 下 ， 那 么 实际 上 不 计算 Px 的 元 
索 而 是 自动 地 填 人 运 当 数 目的 零 元 ， 并 给 剩 下 的 一 个 元 素 髓 什 
于 5。 在 Pd 中 对 应 的 值 是 零 与 于 9， 因此 由 (39.9) 得 知 ， 影 响 到 
误差 矩阵 仅 有 一 个 元 素 干 忠 。 因 此 我 们 一 般 性 的 分 析 概 括 了 这 样 
的 一 列 的 特殊 情况 . 


用 近似 的 初等 Hermite 矩阵 序列 的 乘法 


45. 在 许多 算法 中 要 涉 及 (sn 一 1) 个 初等 Hermite 矩阵 的 序 
列 己 , P,…*。Poz， 其 中 对 应 于 P, 的 向 量 w, 的 前 > 个 分 量 是 
零 。 我 们 首先 考虑 左 秉 。 用 ,表示 计算 的 P,,， 用 有 4, 表示 计 
算 的 变换 。 于 是 有 
4 Podo we Fo, Folls < (12.36) 2 Aols, (45.1) 
ts — PA = Fo, Fs < (12.36)2°]A, le. (45.2) 
因此 :如果 记 〈12.36)2 一 x， 那么 
和 4 一 PP ee PAols xl + C+) 
+ tre) ds < Ca—1) Ct) rlAolls, 
(45.3) 
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我 们 只 对 zz 明显 地 小 于 1 的 结果 感 兴趣 ， 因 此， 尽管 因子 
(1 十 x" 是 按 指数 形式 增长 ,但 是 在 应 用 范围 内 它 没有 什么 影 
咏 。 于 是 我 们 的 界 本 质 上 是 (12.36)。w，2™ 4ollz。 这 是 令 人 十 
分 满意 的 ,如 果 注 意 到 我 们 还 没有 把 误差 的 统计 分 布 考虑 在 内 ,我 
们 就 更 加 感到 满意 . 
根据 我 们 的 经 验 ,用 1,( ” ) 方式 的 计算 已 被 证 明 甚至 比 考 不 
统计 分 布 所 得 的 更 精确 。 注 意 ， 我 们 的 论证 在 某 些 方面 存在 车 弱 
点 ， 因 为 像 在 (44.6) 中 那样 , 我 们 用 整个 矩阵 的 范 数 代替 了 每 一 
步 中 行 被 修改 过 的 矩阵 的 范 数 。 
如 果 令 do 一 1, 我 们 就 得 到 〈*” 一 1) 个 近似 的 初等 Hermite 
抑 阵 的 乘积 的 误差 界 。 即 
NCP, 五。 五) 一 PP Dolls < nix(l + xz) 
一 《12.36)pi2-[1 十 (12.36)p2-]*。 (45.4) 
关于 相似 变换 ,我 们 立刻 从 (4 (45.3) 得 到 结果 : 
14。 一 PP PiA4oP Ps< 和 2 一 T 
《1 + x#)" trl.Aolls. (45.5) 
这 里 不 存在 平面 旋转 讨论 中 出 现 的 那 种 特殊 类 型 的 困难 ， 因 为 我 
们 的 分 析 并 没有 企图 建立 逐次 变换 矩阵 的 名 步 之 闻 的 特殊 关系 . 
最 然 可 以 用 任何 顺序 作 乘 法 而 不 影响 界 。 研 究 下 述 假设 的 试验 我 
们 可 以 看 出 对 于 一 般 和 矩阵 ,因子 a2-! 不 大 可 能 改善 ， 假 定 按 下 述 
方式 产生 一 个 矩阵 序列 .给 定 ” 个 准确 的 初等 Hermite 乍 阵 P(r 
一 1， 2,……,#), 并 且 从 4 开始 建立 ”个 矩阵 元 (7 一 1; 2 …:m) 
如 下 。 准确 地 计算 Pri4rPti， 然后 伟人 得 到 的 矩阵 的 元 素 为 
位 浮 点 数 ,这 就 从 4 导出 了 4wm， 如 果 我 们 写 


Ln PnAdPnt Gray PP 一 Bop (45.6) 
那么 ,显然 Gr+: 的 元 索 的 最 优 的 界 是 
[Glys S27 Br lii, 《45.7) 
因此 ， 
lGnlls 27 Bords. (45.8) 


对 于 最 终 的 矩阵 4。 的 误差 ,我 们 的 最 优 的 界 为 
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N14, ~ PP :PAoP: PP 
所 2 [二 (IT2 + ls (45.9) 
因此 , 它 本 质 上 是 22 -dollr。 
如 果 如 对 称 ， 那 么 矩阵 序列 可 以 始终 保持 对 称 性 ; 而 且 改 
写 这 个 计算 ， 使 计算 最 极 小 是 方便 的 。 我 们 在 第 挨 章 叙述 有 关 的 
变换 时 将 进行 讨论 。 


类 似乎 面 旋转 的 非 西 初等 矩阵 


46, 用 西 变换 的 算法 数值 稳定 性 高 ,其 根源 在 于 2 范 数 和 Eu- 
did 范 数 是 酉 不 变 的 。 这 里 暂且 不 考 苛 命 入 误差 ， 因 此 逐次 变换 
的 抵 阵 的 元 素 大 小 ,一 般 不 逐步 增长 ,这 是 重要 的 。 因 为 在 任何 阶 
朋 中 当前 的 含 人 误差 本 质 上 是 与 变换 矩阵 元 素 的 大 小 成 出 例 的 。 

非 本 初等 抵 阵 没有 这 一 类 自然 的 稳定 性 质 ， 但 是 可 以 把 计算 
安排 好 ,并 赋 于 它们 有 限 的 稳定 形式 . 我 们 首先 考虑 $ 20 的 问题 ， 
我 们 有 向 量 #, 并 用 一 个 矩阵 左 科 , 使 它 的 第 i 个 元 素 变 为 零 , 左 
酌 只 影响 z 的 第 ; 和 第 j 个 元 素 ， 即 用 它们 的 初始 信 的 线性 组 合 
来 代 普 。 现 在 我 们 用 和 矩阵 Mi (第 一 章 $ 40, vi) 左 乘 也 有 奖 似 
的 效果 ,第 i 个 元 素 改 变 为 改 ,其 值 为 

x 一 一 zj + 而， (46.1) 

其 他 所 有 的 元 素 保持 不 变 。 我 们 取 my 一 二 j 喜 可 以 化 性 为 替 。 
但 是 。 如 果 这 样 做 mi 的 值 可 以 任意 的 大 ， 可 能 是 无 穷 。 因 此 ， 
Mall 可 能 任意 大 ,被 Ms 左 乘 任 一 矩 阵 4, 在 它 的 第 j 行 上 可 
能 有 任意 大 的 重 。 显 然 , 从 我 们 作 的 分 析 可 以 得 出 结论 , 这 种 取 法 
是 不 能 令 入 满意 的 。 

我 们 可 以 引进 一 个 称 定性 的 度量 如 下 : 

i) 着 | 如 | 所 j 和 1， 则 按 上 述 的 方法 进行 并 且 有 mi 所 1。 

(0 着 [二 | > | 十 |， 则 首先 用 i (第 一 章 ,§ 40, i) 左 乘 。 
这 样 ,地 i 和 第 ; 元 素 互相 交换 ,然后 用 适当 的 Mj 相 乘 。 

因此 ,用 作 左 乘 的 插 阵 可 以 表示 为 M51;i， 其 中 1;; 是 14 或 
者 了 这 取决 于 是 否 有 必要 进行 交换 .我 们 还 没有 包括 和 一 芭 一 0 
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的 情况 。 这 种 情况 不 会 产生 困难 ,我 们 仅 需 令 
了 一 {46.2) 
结果 得 Mn; 一 
答 阵 乘积 Mal 的 效果 比 得 上 在 (i, 站 平面 上 的 旋转 ， 可 
以 期 望 它 是 稳定 的 。 我 们 用 M$ 来 表示 这 个 乘积 ,简单 的 计算 证 
明 


ib< [G+] (463) 


与 一 系列 在 平面 (1, 2), (1, 3)，…，(1l #); (2, 3),-**, (2, 
42);*…5 (nz 一 1, #) 上 的 旋转 的 算法 对 照 , 我 们 有 相应 的 算法 , 它 
使 用 一 组 矩阵 ; 
Ma Mas °° Mus Mas es Mees Monte 

我 们 不 能 够 给 出 任何 导致 ms2 人]4[ 形式 的 界 的 一 般 狂 误差 分 
析 ， 对 于 一 般 的 矩阵 ， 用 一 般 的 变换 可 能 达到 的 最 好 的 界 通 常 是 
2"z42 一 4d| 形式 的 。 因 此 ， 在 以 后 各 章 适 当 的 地 方 , 我 们 仅 给 出 
特殊 的 分 析 . 

在 一 些 含 有 初等 变换 序列 的 算法 中 交换 是 不 允许 的 ， 因 为 它 
会 破坏 先前 各 步 引入 的 零 元 素 的 分 布 形式 。 为 了 实现 这 些 算法 ， 
我 们 不 得 不 依 业 Mi 矩阵 而 不 使 用 M#， 因此 ,在 这 些 算法 中 可 
能 出 现任 意 的 不 稳定 的 情形 。 这 样 的 算法 没有 与 平面 旋转 的 算法 
相对 应 的 办 法 ， 因 为 使 用 这 种 算法 就 像 使 用 Mi 一 样 ,必定 会 破 
坏 零 元 素 的 分 布 . 


类 似 于 初等 Hermite 炬 阵 的 非 本 初等 矩阵 


47. 同 理 ， 我 们 可 以 通过 研究 $ 37 的 问题 引入 类 似 于 初等 
Hermite 矩阵 的 非 西 矩 阵 。 这 个 问题 是 对 于 给 定向 量 x， 决 定 矩 
阵 M ,使 得 Mx 的 前 ”个 分 量 不 变 , 第 " 十 1 个 到 第 = 个 分 是 为 
零 。 我们 考 虚 用 N，( 第 一 章 $ 40， vi) 左 乘 *。 我们 若 记 

x = Nw, (47.1) 


则 
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Hr = 1, 2 7), 
rit (i rt 1 1), (47.2) 
取 
mr rrr (Fr 1 1), {47,3) 
我 们 可 以 看 出 条 件 已 被 满足 .但 是 N, 的 元 素 可 以 任意 大 ， 甚 至 
是 无 穷 ， 这 将 导致 数值 不 稳定 。 稳定 性 可 以 这 样 来 得 到 : ”假定 
wi1Gi = 7,…，#) 的 最 大 值 在 i 心 之 +r 达到 。 定义 向 量 y 
为 


y= Lrxs (47.4) 
这 是 * 中 调换 元 素 x, 和 元 素 zx 导出 的 。 因 此 
ly Gr) (47.5) 


如 果 选 取 N, 使 得 N,y 的 第 (rz 十 1) 到 第 = 分量 是 零 ， 我 们 得 
到 
ni, 一 Jr 《47.6) 
且 
oz 1. (47.7} 
因此 矩阵 N， 的 元 素 的 模 的 界 不 大 于 1, 并 且 我 们 已 得 到 数值 稳 
定性 的 某 个 度量 ， 事实 上 ,我 们 得 到 
1 中 二 
he 和 
(47.8) 
我 们 用 N， 表 示 算 隆冬 积 N,1w. 如 果 1 二 0(i 二 7,…*,#), 那 
么 就 令 N; 一 1. 显然 ,使 用 Ni 能 获得 与 秉 积 M;swM sz- MM 
同样 的 效果 ,但 是 从 同一 向 量 * 开始 ,我 们 一 般 没 有 
Ne = MrneMorar Ms {47.9) 
如 果 不 需要 作 交 换 , 等 式 (47.9) 将 被 满足 ， 在 给 定 的 集合 中 选取 
最 大 的 元 案 的 过 程 通常 称 作 “ 按 大 小 选 主 元 ”。 
对 应 于 用 一 组 前 ”一 ! 个 分 量 为 零 的 wi; 构成 的 初等 Hermite 
抵 阵 (7 一 2wrw7) 的 算法 ,我们 有 采用 知 阵 Ni，N:， …，Ns。- 
的 算法 。 通常 我 们 不 会 有 导出 的 界 能 与 基于 Hermite 和 矩阵 的 变 
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的 的 界 相 比 的 一 般 几 的 误差 分 析 ， 我 们 称 M% 和 入; 为 稳定 的 
初等 姑 隆 

和 以 前 一 样 。 我 们 发 现 有 些 用 初等 相似 变换 的 算法 不 允许 在 
每 一 步 作 交换 ， 因 为 它 会 破坏 先前 的 变换 产生 的 零 元 分 布 。 某 些 
算法 满 在 着 不 稳定 狂 ， 需 要 慎重 的 考虑 。 它 们 没有 根 应 于 用 初等 
Hermite 矩阵 的 算法 、 因 为 使 用 这 些 算法 与 使 用 交换 一 样 不 可 避 
免 地 会 破坏 零 元 分 布 。 

本 书 中 我 们 会 反复 允 到 一 个 问题 ， 那 就 是 选用 初等 西 矩 阵 还 
是 初等 稳定 的 矩阵 ，…… 般 地 说 ,初等 稳定 变换 稍 简单 些 ,但 另 一 方 
面 , 它 不 能 保证 可 靠 的 数值 稳定 性 。 


甩 非 丁 矩 阵 序列 堪 乘 


48. 有 一 种 变换 是 用 N, 型 矩阵 的 ,对 这 种 变换 我 们 能 给 出 相 
当 令 人 满意 的 误差 分 析 ， 这 是 用 一 系列 矩阵 Wi, 天 …, 和 Ns_, 左 
柔 矩 阵 4o。 我 们 写 
A, = H(A) = NA + H,, (48.1) 
HH, 是 实际 冬 法 中 产生 的 误差 逢 阵 . 用 fr 左 乘 仅仅 是 调换 第 ” 和 
第 ” 行 ,因此 没有 合 人 误差， 以 后 用 元 左 乘 , 第 1 行 到 第 7 行 
不 变 ， 因 而 H, 的 这 些 行 是 零 . 对 于 ”一 1 到 = 一 1 反复 使 用 关 
系 式 (48.10)， 类 似 于 $ 15 的 论证 ,给 出 
hd 
Tt CW) ND) Hl (48.2) 
因此 , 矩阵 A， 准确 地 与 (48.2) 式 右边 方 括号 内 的 矩阵 相 括 。 
现在 我 们 证 表 
(NN (NH, 一 有 1 《48.3) 
我 们 有 


(NH, ~ (NL ) tH, ~ TDH,, (48.4) 
现在 区 与 矩阵 六 相 邮 ,只 是 对 角 线 以 下 的 元 素 的 符号 被 改变 
了 ,因为 用 六 左 苛 只 是 用 第 7 行 的 零 倍 加 到 第 《r + 1) 行 至 
第 4# 行 ,因此 


els 


N71H, = H,. (48.5) 

又 因为 r' > +r， 和 矩阵 iv 好 的 第 1 行 至 第 r 一 1 行 是 零 , 所 以 

(NW) TH, = IH,. (48.6) 

继续 这 个 论证 ,我 们 得 到 《48.3)}。(48.3) 右边 的 矩阵 只 是 行 置换 

后 的 H,， 因 此 等 式 (48.2) 证 明了 4。-， 是 准确 地 相抵 于 有 下 述 
摄 动 的 44。， 

Taw 十 TlarHy 十 十 ao (48.7) 

因此 ， 每 一 组 误差 马 的 影响 等 价 于 在原 上 仅仅 出 行 昌 妆 所 


的 以 组 记 的 报 动 . 这 些 误差 及 区 到 厌 仿 阵风 溉 有 发 生 放 大 (注意 ， 
加 果 没 有 用 交换 ， 这 些 结果 当然 是 正确 的 )， 用 M; 型 拭 阵 右 乘 ， 
自然 有 类 似 的 结果 。 其 中 

M; = TMos (48.8) 
而 用 7rr 右 乘 产生 列 交换 . 

我 们 从 这 一 值得 重视 的 结果 立刻 看 出 ， 不 稳定 性 的 危险 仅仅 
在 于 HH, 本 身 有 可 能 是 大 的 。 因 为 在 任何 一 步 造成 的 误差 通常 与 
变 痪 矩阵 当时 的 元 素 的 大 小 成 比例 。 由 此 可 见 ， 保 证 到 的 元 案 
尽 可 能 小 是 多 么 重要 .因此 ,交换 是 本 质 性 的 . 

读者 应 该 验证 用 矩阵 Mh 做 变换 时 ,相应 的 分 析 得 不 出 这 样 
满意 的 结果 。 在 原 矩 阵 上 的 等 价 摄 动 具有 复杂 得 多 的 结构 。 

先 验 的 误 闽 界 

49. 我 们 已 经 看 到 ， 对 于 茶 些 用 酉 变换 的 算法 ,我 们 能 够 找到 
对 原 矩 阵 的 摄 动 的 先 验 的 界 ， 这 种 摄 动 等 价 于 在 实际 计算 中 产生 
的 误差 。 旭 然 第 二 章 的 主题 说 明 在 用 对 称 炬 阵 必 相似 变换 求 特征 
值 时 ， 我 们 可 以 给 出 特征 值 误差 的 先 验 的 界 。 但 是 ,一 般 来 说 ,不 
能 给 出 我 们 希望 计算 的 量 的 误差 的 先 验 的 界 ， 甚 至 对 上 述 这 种 最 
好 的 情况 ,我 们 也 得 不 到 特征 向 量 的 误差 的 先 验 的 界 . 可 是 原 矩 
阵 的 等 价 摄 动 的 先 验 界 ， 对 于 评价 有 关 的 算法 的 性 能 是 有 重大 训 
义 的 ， 

我 们 将 发 现 对 等 价 的 福 动 了 所 能 得 到 的 最 有 效 的 界 以 某 种 范 
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数 表 示 为 

FT < "2 一 4 (49.1) 
其 中 多 通常 是 小 于 3 的 常数 ， 通 常 仅仅 对 以 西 变 换 为 基础 的 算法 
才能 得 到 这 样 的 界 . 对 于 稳定 的 初等 非 西 变换 ,如 下 形式 的 界 通常 
都 很 难得 到 


[i (49.2) 
我 们 认为 ,这 样 的 界 常常 对 某 些 特 殊 的 方法 存在 ,这 是 为 了 说 明 因 
子 世 只 在 极 不 利 的 情况 下 才能 达到 。 对 于 不 稳定 的 非 丁 变换， 
即使 是 形 如 (49.2) 的 界 通常 也 不 能 得 到 。 确实 存在 与 厌 问题 的 病 
态 毫 无 关系 的 中 断 的 情况 ， 它 完全 是 因为 出 现 零 的 除数 使 变换 不 
能 继续 下 去 。 


正规 性 的 偏离 


50. 为 了 获得 给 定 的 算法 产生 的 误差 的 界 ,我 们 不 仪 需要 原 矩 
阵 的 等 价 报 动 的 界 ， 而 且 希 要 关于 计算 的 量 的 敏感 性 的 界 ， 自 然 
要 间 ， 在 特征 值 问题 中 是 否 有 估计 敏感 性 因 案 的 简单 方法 。 从 第 
二 章 (3.12) 我 们 知道 , 假若 4 是 正规 的 ， 那 么 〈4 二 F) 的 特征 
值 落 在 下 述 圆 盘 之 内 
nl lh elels. (50.1) 
因此 ,我 们 可 以 期 望 。 如 果 4 几 平 是 “正规 矩阵 ”, 那 么 它 的 特征 值 
是 比较 不 敏感 的 。 如 果 4 是 正规 的 ,那么 (第 一 章 $ 48) 有 酉 矩阵 
RK 使 得 


REIAR 一 diag(%), (50.2) 
对 任何 矩阵 (第 一 章 $ 47) 有 西 矩 阵 R， 使 得 
RIAR 一 diag(%) 十 了 一 忆 十 了 ， (50.3) 
其 中 了 是 严格 上 三 角 型 , 即 
万 一 0 (i )), {50.4) 
我 们 可 以 合理 地 把 TI/41| 作为 “4 的 正规 性 的 偏离 ”的 度量 
Henrici(1962) 曾经 使 用 关系 (50.3) 按照 下 述 方式 得 到 在 4 
上 的 摄 动 对 其 特征 值 影 响 的 估计 。 
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设 6 定 义 为 
RI(AT+ F)R=D+T+G, {50.5) 
办 此 、 
Go= RIFR, |Gl, = Fl, Glls = Flle. (50.6) 
如 果 2 是 (4 十 下) 的 某 一 个 特征 值 ,那么 (D 一 41) 十 T 十 6G 是 
奇异 的 。 我 们 区 分 为 两 种 情况 来 讨论 . 
(i) 对 某 个 1， 2 一 453 
(ii 对 任何 i, 和 关 。 在 这 种 情况 下 (D 一 47) 和 (D+ 
了 一 27) 都 是 非 奇 异 的 ,因此 ， 
OdetlD+T—A+G] -detD+ 7 ~— A]detll 


+ (D+T— U6], (50.7) 
这 给 出 
Odetll + (D+T— 11)76], (50.8) 
等 式 (50.8) 意味 着 


1<N(D+ TC— 7)6 
D+ To Hlel 
= | + KT)T Kl GH, 
其 中 (50.9) 
K=(D— A) "= ding[(1; 一 2 
= li— KT+ (KTP— 
+ C—D" KT) KGh,. (50.10) 
因为 KT 是 严 格 上 三 角 , 所 以 (KT) 二 0 (7 冤 ). 
记 
Kb = a, ITIh = 8, frls = ¢, (50.11) 


则 有 
1<(+ab+apt+ + erp alGl (50.12) 
(ltacteet+ :+ a ct)olGls. (50.13) 
注意 ,如 果 我 们 用 任何 较 大 的 量 代替 “， 这 结果 仍然 正确 。 现 在 
ea 一 | 有 有 一 1minl2 一 1。 (50.14) 
因此 , (50.13) 说 明 存在 % 使 得 
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_ 11 —1 
li+act eot :+ a te 


< lol = Fl < HFile. 


(50.15) 

当 用 代替 < 时 ,同样 的 结果 成 立 。 
因为 在 情况 (i) 中 关系 (50.15) 显然 是 对 的 ， 因 此 它 在 所 有 
情况 下 成 立 ， 当 4 是 正规 矩阵 时 “ 一 0, 因而 结果 简化 为 (50.1)。 


简单 的 例子 


51. 这 个 结果 不 受 第 二 章 426 讨 论 的 限制 的 支配 ， 例 如 ， 如 果 
我 们 取 


1 8 
4 一 i, ，| Fi 一 9。 (51.1) 
1 & 
1 
那么 ,2 一 8. 记 11 一 ?1 一 8, 我 们 得 到 


§ 
GT 
如 果 4 一 10, 8 一 10-*,% 一 10*， 那 么 5 的 极 大 值 是 方程 
一 107%[1 + (107"/8) + (C107%/8) 十 + C107*/5)’] 
(51.3) 
的 解 ,并 且 它 显然 在 10 到 10 (1 十 107) 之 间 。 
为 了 利用 (50,15)， 我 们 需要 一 个 比较 容易 计算 的 “ 的 上 界 。 
4 是 正规 矩阵 的 充 要 条 件 是 〈4*4 一 44") 为 零 ， 因 此 ,我 们 有 
理由 期 户 < 与 (444 一 44#) 有 关 。 事 实 上 ，Henrici(1962) 已 
经 证 明了 
ce (Ga) {434 一 449 睹 ， (51.4) 


其 中 需要 计算 两 个 捧 阵 的 缚 法 。 因 为 一 个 矩阵 乘法 有 邮 次 滋 法 ， 
这 个 工作 量 是 不 可 忽视 的 ， 
可 是 ,一 个 矩阵 可 能 偏离 正规 性 很 远 ,但 是 其 特征 值 不 是 病态 
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的 。 例 如 ,考虑 矩阵 
1 2 

4-[， | G15) 

这 里 5 一 c 一 2， 因此 如 果 * 是 (4 十 了 ) 的 一 个 特征 信 ， 那么 
我 们 的 结果 表明 ， 
41 


TT < Fle, (51.6) 
或 者 1 -3 
TF 7 3 <lFle = 7, (51.7) 
妇 
[| 
2 
1 (51.8) 
或 者 一 3| 和 各 [十 (P89) 


并 且 这 些 圆 的 半径 都 大 于 (24)#。(51.9) 给 出 这 个 矩阵 的 左 、 右 
特征 向 量 


4 一 3; 籽 一 [0,1] 和 x3[1, 1]， 
b=1; = 11, 一 1] 和 x3[1, 0]. 
此 (第 二 章 $ 8) |aj 一 lei 一 2， 如果 是 谱 条 件数 ， 那 么 
从 第 二 章 的 关系 式 (31.8) 得 到 “< 1:| 十 151 世 对 ,而 第 二 
章 的 (30.7) 说 明 (4 十 F) 的 特征 值 沙 在 下 述 图 内 ; 
fi 一 1 < 2in, 
2 32, 
显然 ,在 4 是 小 量 的 时 候 , 结 果 (51.8) 是 十 分 弱 的 。 


后 于 的 办 


52. 目前 对 一 般 的 非 正 规矩 阵 的 特征 值 的 摄 动 ,似乎 还 没有 任 
何 有 用 的 先 验 界 .上 一 节 的 结果 虽然 是 弱 的 ， 但 是 为 了 估计 符 阵 
正规 性 的 伤 离 就 需要 2”* 次 乘法 。 我 们 将 叙述 的 某 些 现代 的 算 
法 决定 整个 特征 系 需 要 的 乘法 量 只 是 w 的 一 个 小 的 倍数 ,从 近似 
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{51.9) 


(51.10) 


计算 的 特征 系 能 得 到 特征 值 的 十 分 精确 的 估计 并 不 是 坦 外 的 。 从 
计算 的 特征 系 或 部 分 特征 系 决定 的 误差 的 办 称 为 后 验 的 界 。 对 于 
非 正规 箱 阵 主要 是 依靠 后 验 的 界 。 


正规 矩阵 的 后 验 的 界 

53. 候 定 矩阵 4 的 一 个 近似 特征 信 是 ze。 对 应 的 特征 向 量 是 
v， 我 们 考虑 一 个 向 量 9， 其 定义 是 

(4— pl)v= Av— pr=. {53.1) 

通常 称 它 为 对 应 于 4 和， 的 剥 余 向 量 .要 是 + 和。 是 准确 的 话 ， 
?就 是 办 了 。 因 此 , 若 ? 是 “小 "的 ,我 们 可 以 期 望 4 是 特征 值 的 一 
个 好 的 近似 什 

如 果 4 的 初等 因子 是 线性 的 ,那么 ,存在 及 使 得 

Hdiag( hi)H™! = A. 


因此 ,从 《53.1) 有 
Hdiag(hi 一 erlo = 9, (53.2) 
有 下 述 两 种 情况 出 现 : 
(i) 对 某 个 i hj; 
Gi) 对 一 切 i, 为 关 p， 此 时 (53.2) 给 出 
?一 Hdiagl (bi 一 pp) Hy. (53.3) 
因此 ,对 任何 一 种 对 角 和 矩阵 的 范 数 为 其 最 大 元 素 的 范 数 成 立 
lol < liala ldiagL CG 一 a) 7 Nilall 


= max— ANA. (53.4) 
一 | 
因此 使 用 2 范 数 有 
miniz 一 4d < linda/ lel, (53.5) 


其 中 与 $51 的 相同 在 情况 (i) 中 ,关系 式 (53.5) 显然 成 立 。 
因此 ,我们 得 知 在 以 & 为 中 心 ,以 slimll/iivll 为 半径 的 国内 至 少 
有 4 的 一 个 特征 值 。 显 然 ,假设 ilvls 一 1 并 不 失去 一 般 性 ,从 现 
在 起 我 们 就 这 样 假定 ， 因 为 一 般 说 来 ,我 们 对 没有 一 个 预先 的 


佑 计 。 因 此 ,除非 我 们 有 更 多 的 特征 系 的 信息 ,否则 这 个 结果 是 没 
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有 多 大 实际 意义 的 。 然 而 , 当 4 是 正规 矩阵 ,我 们 知道 “一 1。 那 
么 ， 这 个 结果 证 明了 在 中 心 为 &， 半 径 为 如 也 的 加 盘 内 至 少 有 
一 个 特征 值 。 

有 另 一 个 车 虑 《53.1) 的 途径 , 它 把 这 个 结果 与 第 二 章 联系 起 
来 ，(53.1) 式 隐 含 项 

{A— mi)r= Ag— nw) = Av — 1= pv, (53.6) 

因此 ,和 "是 矩阵 〈4 一 mv*) 的 准确 的 特征 值 和 特征 向 量 , 从 
第 二 章 $ 30, 我 们 知道 (4 一 we”) 的 全 部 特征 值 落 在 下 述 加 妇 
之 内 : 


3% ele = llal 全 一 本 2。 (53.7) 
这 样 的 结果 与 我 们 刚才 得 到 的 一 样 。 


Rayleigh 商 


54. 如 果 给 定 基 个 向 量 rz， 那么 我 们 可 以 选择 使 得 1140 一 
-Pb 达到 极 小 ， 记 x 一 oAv 并 且 假 定 lv 一 1， 我 们 得 到 
上 dz — po = (49 — po) (4v — pv) 
yANAv 一 set 十 (PH 一 SHUP 一 外。 (54.1) 
显然 ， 当 天 一 “一 oa4 了 时， 极 小 值 被 达到 , 这 个 量 称 为 对 应 于 
“的 Rayleigh 商 , 我 们 用 wx 表示 .用 “ 商 ” 这 个 术语 是 因为 如 果 
”不 是 规范 化 的 话 ,正确 的 值 是 vs4v/vHw。 显 然 ,如 果 


Av 一 pav 一 Nes (54.2) 
那么 
ying 一 0 (54.3) 
假若 对 于 征 何 # 我 们 有 
Av — po = (lall, = 8), (54.4) 
那么 
42 ~ pav = sa (larll < 8). (54.5) 


这 个 贺 盘 的 中 心 为 pe， 其 半径 至 少 与 别 的 对 应 的 # 一 样 小 ， 
Rayleigh 商 是 对 于 任意 的 矩阵 定义 的 ， 但 是 ， 我 们 即将 证 明 
对 于 正规 矩阵 它 是 特别 重要 的 。 假 定 我 们 有 
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42 一 pgu = a Nols = 1; lab 一 se)， {54.6) 
并 且 已 知 ?一 1 个 特征 值 满足 关系 
5 pal > a, (54.7} 
其 中 = 是 某 个 常数 。 我 们 可 记 有 关 的 特征 值 为 1, 4h,………,4s。 如 
果 4 正 规 ,那么 必定 有 正 交 规范 特征 向 盘 系 xi(i 一 1,…, 4), 并 
且 我 们 可 以 写 


oo Dan, 1 Dab, (54.8) 
因此 (54.6) 式 给 出 ， 
1 = Da 一 mr 
于 是 ， ， 
lap — mb Blah — mp (549) 
> 利用 (54.7D)) (54.10) 
由 此 我 们 导出 
la 一 1 一 六 lep>1 一 om G54.1D 
如 果 我 们 用 下 述 关系 式 定义 6。 
本 一 | | ee, (54.12) 
那么 
ve B= lelx 十 立 0 {54.13) 
因此 ， 


lee — a (lol — 1 + 3 Jol 


efa' 2 6 人 
+ 54.14 
(tlaly a “a C3414) 


从 《54.14) 我 们 看 出 ,如 果 a 六 8， 那么 ze-” 很 接近 4， 常 数 
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因子 “-” 是 不 重要 的 。 贿 着 * 的 下 降 。 这 个 结果 变 得 全 来 全 
直到 。 与 数量 级 相同 的 时 候 ,结果 变 得 毫 无 用 处 .注意 ,不 管 wa 
是 不 是 Reyleish 部 ,到 目前 为 止 ,我 们 得 到 的 结果 都 成亲。 
Rayleigh 商 的 误 痢 

55. 现在 转 到 ju， 从 它 的 定义 ,我 们 得 到 


pa = A = Del 《55.0 
因此 ， ， 

ma le 
这 给 出 


(px CO— hal py (1; 一 pp) lol? 


= BD 1G — pe) blosh /0 — pr)™. 
(55.2) 
从 (54.11), (54.7) 和 (54.9), 我 们 得 到 


(CA SE 


。 

< BD) I — pal lok/a 
2 

< ea, 


a ~ 41 < 一 外) (55.3) 


关系 式 (55.3) 表明 : 如 果 a > s，Rayleigh 商 的 误差 与 e? 同 阶 。 
随 着 4 减 小 ， 结 果 逐 步 变 弱 ; 直 到 与 s 数量 级 相同 时 , 它 比 不 上 
任何 满足 4v 一 ez 一 = 的 # 的 结果 ， 

下 面 的 例子 表明 : 当 。 与 6 闻 阶 时 ，Rayleigh 商 和 疝 量 的 误 
差 的 界 变 环 是 必然 的 ， 游 叫 矩 阵 4 并 宣称 特征 值 和 特征 向 量 为 ; 
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我 们 对 于 规范 化 向 量 ” 得 到 

4 — wer — [| (55.5) 
因此 Im 册 一 a， 特征 信和 是 5 土 6， 因 而 we 有 8 阶 的 误差 .特征 
向 量 是 

1 1 

[ ,lal 1. G30) 
这 说 明 ov 不 是 一 个 近似 的 特征 向 量 . 
Hermite 和 矩阵 


56. 我 们 经 常 要 涉及 的 正规 挎 阵 是 Hermite 第 阵 ， 并 且 通 常 

是 实 对 称 矩 阵 ， 复 Hermite 矩阵 的 特征 值 问 题 的 求解 可 篇 化 为 
下 述 实 对 称 和 矩阵 问题 。 设 

4 一 B 十 iC (8 和 C 都 是 实 的 ), 

BT~B, CT=——C. 
如 果 1 是 4 的 特征 值 (必然 是 实 的 ), 并 且 (wi 十 zz) 是 对 应 的 
特征 向 量 ,我 们 有 

(B + iC) (uw Ft iv)) = blue t ivi), 


(56.1) 


邵 加 
i CV; hit 
因此 {ex + Bu= po” (56.2) 
[= 
[ | [| 一 | | (56.3) 
又 因为 
[2 ] 和 [ ] (56.4) 
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正 交 ， 扩充 的 实 矩 阵 有 二 重 特征 值 2。 显 然 , 这 个 扩充 的 矩阵 是 
实 对 称 的 , 其 特征 值 是 家, 2，2 和 ，……，j，j 加 ， 大 多 数 寻找 实 
对 称 和 矩阵 特征 系 的 较 好 的 算法 都 导出 实 的 近似 特征 值 和 特征 向 
量 ， 我 们 提 过 的 圆 盘 因 此 变 为 实 轴 上 的 一 些 区 间 ， 


注意 ,如 果 pa 是 对 应 于 "的 Rayleigh 商 并 且 


Av— ppv yy, (56.5) 
那么 因为 wv 一 0, 我 们 有 
(4 — nv ~ oN) ppv (56.6) 


因此 ,对 于 和 矩阵 〈4 一 59v7 一 v4"),v 和 pr 是 准确 的 。4 是 对 称 
时 ， 这 个 和 扼 阵 也 是 对 称 的 。 这 里 我 们 水 及 的 是 对 称 矩 阵 的 对 称 报 
动 。 如果 je 中 一 1 和 9 一 0 时 ,我 们 容易 验证 下 式 成 立 。 
vv 一 胎记。 《56.7) 
如 果 我 们 得 到 = 个 近似 的 特征 值 和 特征 向 量 ， 并 县 各 个 区 间 
是 不 相交 的 ， 那 么 我 们 知道 在 每 一 个 区 间 内 存在 一 个 特征 值 。 上 
一 节 的 结果 能 用 于 特征 值 的 高 精度 的 估计 ， 除 非特 征 值 是 非常 密 
集 难 分 的 。 如 果 对 于 4 阶 和 矩阵 , 我 们 有 Rayleigh 商 十 和 剩余 ni 
如 (56.8) 所 示 : 


i 1 2 3 4 

机 0.1 0.1001 0.2 0.3 
linall 10™ 2-10% | 2.10% |3 ,10 
(56.8) 


那么 ,我 们 立刻 知道 ,在 下 述 的 每 一 个 区 间 至 少 有 一 个 特征 值 . 
1%—01l <10%, | — 0.1001| <2.10%, 
(2—02| <2.10", [1—03| <3.10% 

这 些 区 间 显然 是 不 相交 的 ,因此 每 一 个 区 闻 只 包含 一 个 特征 值 。 

现在 我 们 用 在 第 二 区 间 上 得 到 的 特征 值 % 的 十 分 精确 的 界 

来 说 明 $55 的 结果 的 用 法 。 显 然 ,我 们 有 


= 182 。 


(56.9) 


jp — hl| 0.1001 一 0.1 一 10 一 10 (0.9999)， 
lm ~— hi [0.1001 — 0.2 + 2. 107| > 0.0998, 
lw — hi 10.1001 一 0.3 二 3.107|> 0.1998. 
(56.10) 
因此 ,我 们 到 a 一 10™*(0.9999)， 并 且 (55.3) 给 出 


lm—»l < 5 { [| } 
a 〔(4.0004)10 
不 管 和 罗 可 能 很 大 近 ，Rayleigh 商 是 十 分 精确 的 , 商 me 和 
m 甚至 更 精确 ， 在 实际 上 , 我 们 发 现 Rayleigh 商 是 如 此 精确 ( 除 
了 病态 的 接近 的 特征 值 之 外 ), 以 至 于 必须 十 分 仔细 地 计算 它 才能 
发 挥 它 的 全 部 潜力 。 


病态 地 靠近 的 特征 值 


57. 当 包 含 Rayleigh 商 的 区 间 不 是 互相 分 离 的 上 时候， 情况 是 
非常 模糊 不 清 的 ;不 作 进一步 的 研究 ,我 们 不 可 能 保证 所 有 的 特征 
值 都 包含 在 这 些 区 疝 的 并 集 内 。 我 们 可 以 用 一 个 极端 的 情形 来 说 
明 这 个 范 难 。 假 设 一 个 四 阶 抢 阵 的 特征 问题 ， 其 特征 值 的 分 离 情 
况 是 好 的 ,我 们 用 四 个 不 同 的 算法 来 解 .用 霹 和 wvi(i 一 1 4) 
表示 由 四 个 方法 得 到 的 特征 信 4， 和 特征 向 量 x， 的 近似 值 。 虽 
然 这 些 都 是 同一 个 特征 值 和 特征 向 量 的 近似 值 ,但 是 一 般 说 来 , 它 
们 不 是 己 等 的 ;事实 上 ,vi 通常 是 严格 地 线性 无 关 的 ， 假 若 我 们 提 
出 四 对 ps 和 w， 那 么 我 们 得 到 四 个 重 选 的 区 间 。 如 果 这 些 算法 
都 是 稳定 的 话 ,在 它们 的 并 集 内 仍然 只 有 一 个 特征 值 ， 显 然 ,要 得 
到 有 用 的 和 严格 的 结果 ,我 们 必须 有 更 多 的 信息 ,而 不 仅仅 是 向 量 
的 数学 的 独立 性 . 

王 面 的 论述 将 阐明 这 个 问题 , 假定 v.(i 一 1,.…- ,+r) 是 正 交 
规范 化 向 量 ,并 且 pr(i 一 1,……，*) 是 使 得 

Avi ~ pvi = 1, Nlls — 6. (57.1) 
于 是 存在 一 组 规范 化 向 量 vn,*……, v。, 使 得 以 vi (i 一 1,*…, 7) 


ol83. 


为 其 列 的 矩阵 Y 是 正 交 和 矩阵 ， 现 在 考虑 矩阵 B。 其 定义 为 
五 一 TI4F， (57.2) 
显然 了 是 对 称 的 ， 从 (57.1 我 们 有 
b= vAvi (所 有 i, 站 
= v0 — H) G1, 7). (57.3) 
由 对 称 性 我 们 可 以 写 


其 中 X 是 对 称 的 ,并 且 

{Pi = why 人 一 1 (57.5) 
现在 了 有 4 的 特征 值 4, 4;,……, 7s。 如 果 * 的 特征 值 是 wn 
所 ts pi， 从 Hoffman-Wielandt 定理 (第 二 章 , $ 48) 对 于 
的 某 个 顺序 ,我 们 有 


be 
二 1 
<2(pls + lol) 


一 2 如 a 
2 ek, (57.6) 


因此 , 在 ?个 区 间 志 一 所 < jw 十 的 并 集 内 必定 有 + 个 特 
征 值 。 注 意 ， 卢 不 必 是 Reyleigh 商 . 
作为 一 个 例子 ,我 们 研究 一 个 = 阶 对 角 拖 阵 DD, 其 对 角 元 是 
da Gm 1, 2 a — 1), ds —at+ nie, (57.7) 
我 们 若 取 
y= (tnt, tr,..., tH), pa, (57.8) 
则 有 
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习 一 《0;0，……， 士 6)， {57.9) 
因此 无 论 符号 怎样 分 布 ，linll; 一 s。 众所周知, 如果” 是 2 的 赛 ， 
那么 存在 # 个 (57.8) 类 型 的 正 交 向 量 , 所 有 对 应 的 区 间 的 中 心 都 
是 "。 显然 ， 覆 盖 着 全 部 ”个 特征 值 的 最 小 的 区 间 是 〈a 一 sts) 
到 (a + mie)， 对 应 于 “的 Rayleigh 商 是 (a 十 n-#6)， 因 而 我 


们 不 能 得 到 明显 的 较 好 的 结果 。 
假定 我 们 给 出 了 

Am 一 一 (57.10) 

Mo 一 put = ns (57.11) 
其 路， 一 mw| 全 都 是 小 量 , 并 且 

vv 一 cos (57.12) 
我 们 可 以 写 

Vi = cos0 + wsinO, (57.13) 


其 中 ww 是 单位 向 量 并 与 w 正 交 且 落 在 mm 和 v， 的 子 空间 上 , 用 
ecosg 委 (57.10), 再 被 (57.11) 减 ,我 们 得 到 
Awisin@ — (ps — pwcosd 一 pwisind — 2 — MecosO, 


从 而 


Awi 一 pm =— m3, (57.14) 
其 中 
二 (wosl (57.15) 
sing 
wb < dt lm i 一 上 | (57.16) 
lsin8| 


假定 sa9 不 是 小 量 ,(57.14) 和 (57.16) 显示 出 正 交 向 量 w 和 
wv 有 小 的 剩余 ， 并 且 我 们 能 使 用 以 前 的 结果 , 随 着 9 变 小 这 个 结 
果 逐 新 变 弱 。 


非 正 规矩 阵 


58. 对 于 正规 矩阵 ,我 们 常常 能 够 从 那些 仅仅 是 部 分 特征 系 的 
并 且 不 大 精确 的 信息 中 得 到 十 分 精密 和 严格 的 特征 值 的 界 。 对 于 
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非 正 规 算 阵 这 个 可 能 性 是 很 小 的 . 关系 式 (53.5) 仅 当 我 们 对 “上 有 
了 估计 时 才 有 意义 , 并 且 这 是 从 (53.1) 得 不 到 的 。 即 使 我 们 对 * 
有 了 合理 的 估计 , 当 4 有 一 些 病 态 的 特征 值 ,而 上 恰巧 盈 近 一 个 良 
态 的 特征 值 ,此 时 界 (53.5) 可 能 是 十 分 翡 观 的 。 
可 是 , 假设 我 们 考虑 和 vw,“ 接 近 " 地 通 近 2 的 右 和 左 特 
征 向 量 ,对 这 样 的 wm 和 w 可 写 
wm = Rn f), t= Ut 1), (58.1) 
其 中 fh 是 在 x; 到 x。 的 向 量 张 成 的 子 空间 内 ,8 在 为 到 y。 
张 成 的 半空 间 内 ,并 且 两 者 都 小 。 因 此 我 们 有 
Amul = Ft BTU t+ A + gI) ln 十 有 
= Cnt BA) f(s + gh) (其 中 5 = yn) 


一 加 十 4 {58.2) 
由 此 得 出 
[AA A 
(58.3) 


只 要 不 是 太 小 ， 我 们 可 以 期 望 商 (vi4u/vtu) 会 给 出 2 的 
好 的 近似 . 
对 于 正规 矩阵 ，Rayleigh 商 〈x4ujagm) 是 特别 重要 的 .天 
为 对 于 这 样 的 矩阵 我 们 有 
及 二 (58.4) 
我 们 看 出 商 《8Au1vim) 是 从 正规 矩阵 的 Rayleigh 商 到 非 正规 
矩阵 的 自然 推广 。 我 们 称 它 为 对 应 于 v， 积 的 广义 Rayieigh 
商 . 
现在 假定 我 们 用 一 个 稳定 的 算法 找到 了 对 应 同一 个 特征 值 的 
规范 化 的 近似 的 左 、 右 特征 向 量 w 和 wn， 并 且 我 们 验 明 对 于 定 
义 为 
p= gdaajefmu (58.5) 
的 P。 (4 一 pm) 和 (47v 一 pw) 都 是 小 量 ， 于 是 产生 一 个 
有 信心 的 推测 : ”oj 十 分 马 近 a， 并 且 # 是 如 的 更 好 的 近似 
186。 


值 。 可是， 没有 更 多 的 信息 .我 们 也 不 能 获得 /的 误差 的 严密 的 
界 ; 我 们 甚至 不 能 绝对 地 肯定 % 和 是 对 应 于 同一 特征 人 的 近 
似 特征 向 量 . 


完全 特征 系 的 误 郑 分析 


59, 如 果 我 们 给 出 了 完全 特征 系 的 近似 解 , 假定 这 个 解 有 适当 
的 精度 ,并 且 特 征 系 不 是 过 于 病态 ,我 们 不 但 能 对 所 给 的 特征 系 而 
且 能 对 改进 的 特征 系 给 出 严密 的 误差 界 , 设 py 和 wti 一 1,*…， 
4#) 是 矩阵 4 的 近似 的 特征 值 和 特征 调 量 ,我 们 可 以 写 

Aw — pani = i, Na = 1, {59.1) 
或 者 把 这 些 方程 号 为 矩阵 形式 : 
AU 一 UVdiag(m) = R, (59.2) 
其 中 忌 和 只 分 别 是 以 wt 积 ” 为 列 的 矩阵 、 因 此， 
UAU = diag(j) t UR— diag(1m) + F, (59.3) 
它 使 得 4 准确 地 相似 于 diag(js) 十 F, 这 与 w 和 wn 是 否 是 好 
的 近似 值 无 关 。 可 是 ,如 果 内 和 上 是 好 的 近似 ,矩阵 的 分 量 
就 小 。 如 果 方 程 
UF=R (59.4) 
的 解 王 的 分 量 也 小 , 那么 (59.3) 的 右边 是 一 个 对 角 矩 阵 加 上 小 摄 
动 , 在 第 二 章 8$ 14 一 25， 我 们 也 曾 说 明 如 何 简 化 一 般 矩 阵 的 摄 动 
问题 为 对 角 抵 阵 的 问题 ， 这 些 节 的 主要 部 分 是 致力 于 寻求 形 如 
diag( pz) 十 的 和 矩阵 特征 值 的 界 ,其 中 是 小 的 .所 给 出 的 技术 可 
以 立刻 应 用 到 (59.3) 右边 的 矩阵 , 并 且 除 了 病态 地 靠近 的 特征 值 
之 外 ,都 可 以 给 出 十 分 精密 的 界 . 

车 要 使 它们 的 全 部 潜力 得 到 发 挥 , 仔细 地 计算 RR 和 U™R 是 
很 重要 的 . 算 阵 了 在 有 内 积累 加 的 定点 计算 机 上 可 以 准确 地 得 到 ， 
但 是 (59.4) 的 精确 求解 是 困难 的 问题 。 在 第 四 章 $ 69, 我 们 将 详 
细 地 讨论 它 ， 一 般 来 说 ,即使 R 是 精密 地 给 出 ,我 们 也 不 能 准确 地 
计算 F。 

可 是 ， 如 果 我 们 能 计算 (59.4) 的 一 个 近似 解 ， 并 且 对 定 
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义 为 
G 一 了 一 瑟 
的 G 的 元 素 能 给 出 一 个 界 , 那 么 我 们 有 
UAU = diag(m) 十 下 十 G。 
数值 例子 
60. 我 们 用 三 阶 和 矩阵 4 来 说 明 ， 我 们 已 得 到 


0.6132 0.2157 —0.4157 
F107%| 0.2265 0.3153 0.3123 | 
0.6157 0.2132 -0.8843 
0.8132 
w=| 0.6132 |, lgsl < 10-s, 
0.2157 2 


(59.5) 


(59.6) 


1 《60.1) 


《60.2) 


然后 ,用 对 角 矩 阵 相似 变换 能 得 到 改进 的 特征 值 及 其 误差 的 界 . 事 


实 上 , 用 10” 乘 diag(m) 十 F 十 G 的 第 一 行 和 月 
之 后 (参看 第 二 章 $ 15), Gerschgorin 圆 盘 为 
中 心 0.8132 十 107!(0.6132)》 十 gu 
半径 1077(0.2157 十 0.4157) 十 10- 民 18oi 
中 心 0.6132 二 10- 以 0.3153) 十 gz 
半径 1071(0.2265) 十 10*(0.3123) 十 10 
中 心 0.2157 十 107'(0.8843) -+ gw 


10 乘 第 一 列 
+ lgs1); 
gal + 18 


半径 107'(0.6157) 十 107 (0.2132) 十 1018| 十 |g51。 
回顾 gw 的 界 ,我 们 看 出 这 些 殴 盘 显 然 是 不 相交 的 ,因此 在 中 心 为 


0.81326132， 半径 为 10-X(0.6314) 十 |gal 十 10 


gu| 十 |gaj) 


的 区 盘 内 有 一 个 特征 值 .这 个 回 盘 的 半径 不 大 于 10 (0.6815). 对 
其 他 行列 进行 类 似 的 处 更， 我 们 可 以 改进 其 他 的 特征 入 并 得 到 其 


误差 的 界 。 


与 第 二 章 的 分 析 一 样 做 ， 我 们 发 现 每 一 个 改进 的 ps 的 误差 
的 界 依赖 于 瑟 中 第 行 第 ; 列 元 素 的 大 小 和 jw 与 其 他 ps 的 分 


离 度 。 
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限制 可 达 精 度 的 条 件 


61. 应 该 着 重 指出 :Um'4U 是 准确 地 相似 于 4 的 ， 只 要 充分 
精确 地 计算 巨 ， 我 们 能 保证 diag(mm) 十 的 特征 值 任意 地 接近 
4 的 特征 值 。 在 第 四 章 中 ,我 们 叙述 一 个 方法 ,用 * 位 定点 运算 解 
方程 (59.4) ,保证 是 一 个 使 得 1g#| 所 27maxifus| 的 正确 的 会 
人 结果 . 如 果 我 们 用 这 样 的 技术 ，gs 的 界 就 直接 地 依赖 于 的 
大 小 ,我 们 不 必 对 它 作 先 验 的 估计 ,因为 所 有 的 信息 都 来 自 计 算 之 
局 . 但 是 ,这 对 研究 什么 是 支配 的 大 小 的 因素 是 有 益 的 . 

假若 0 是 准确 的 规范 化 特征 向 量 和 矩阵 ,U7! 的 行 就 应 是 好 jw 
(第 二 章 $ 14)。 因 此 ,我 们 可 以 期 望 , 一 般 地 U! 的 行 ,比如 说 是 
wj， 它 近似 于 六 /si。 现在 ,UT14U 的 (i, i) 元 素 是 wiAwu， 
U7 的 行 是 wj， 我 们 有 

wi = 1。 {61.1) 
(i, 站 这 个 元 素 可 以 表示 为 形式 w14wus/ wu, 因此 按照 $5 ~$8 的 
讨论 , 它 是 对 应 于 wi 积 w 的 广义 的 Rayleigh 商 。 计 算 的 wj4w/ 
gu 值 正 是 用 $59, 60 的 技术 得 到 的 改进 的 特征 值 。 由 此 得 知 ， 
这 一 技术 包含 的 基本 方法 等 价 于 从 给 定 的 一 组 近似 的 右 特 征 向 量 
确定 一 组 近似 的 左 特 征 向 量 ， 接 着 再 计算 2 个 Rayleigh 商 ， 像 
$59，$60 那样 安排 计算 ,我 们 另外 还 得 到 一 个 严格 的 误差 界 。 

轿 为 U7! 的 第 i 行 近似 和 /5， 了 的 第 行 近似 于 YR/s， 
并 且 我 们 可 以 期 望 当 5 小 时 , 这 些 元 素 是 大 的 。 这 将 导致 gj 的 
界 变 坏 。 因此 ， 小 的 在 给 定 的 计算 精度 下 与 接近 的 特征 值 一 
样 限制 了 我 们 可 能 达到 的 精度 是 不 奇 径 的 。 

注意 , 当 我 们 有 了 近似 的 特征 向 量 矩 阵 U，U™! 的 计算 立刻 
给 出 关于 5 的 估计 ， 并 且 从 Hz- 小 的 确定 间接 得 到 “的 估计 。 
可 是 在 这 阶段 ， 我 们 必须 重视 估计 * 的 重要 性 , 因为 在 $59 中 给 
出 的 这 一 技术 的 工作 量 虽 少 , 却 给 出 很 多 的 信息 。 
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非 线 性 初等 因 子 


62. 到 目前 为 止 , 我 们 默认 了 和 矩阵 4 的 初等 因子 是 线性 的 ， 当 
撼 降 有 非 线 性 初等 因子 时 ， 如 果 我 们 用 一 个 化 原 矩阵 为 比较 简单 
的 形式 的 算法 ,那么 一 个 困难 就 立刻 出 现 ， 即 便 是 算法 十 分 稳定 ， 
计算 的 变换 准确 地 与 〈4 十 F) 相似 ，F 的 元 素 充 其 量 是 4 的 元 
素 生 2 的 数量 级 。 现在 我 们 已 着 出 (第 二 章 $ 19) 对 应 于 非 线 
竹 初 等 因子 的 特征 值 对 于 抵 阵 元 索 的 报 动 是 十 分 敏感 的 ， 因 此 变 
换 后 的 矩 降 的 特征 值 也 次 有 相当 合适 的 分 离 度 和 独立 的 特征 向 
量 . 


例如 , 设 我 们 的 原 矩 阵 4 及 其 Jordan 标准 型 为 
11—l 110 
os! 0 | 
9 
0 |. 
3 


22 1 

一 2 1 
显然 ， 矩 阵 4 有 初等 因子 (4 一 3) 和 (2 一 1。 用 十 位 十 进位 
计算 ,即使 一 个 非常 稳定 的 算法 也 可 能 变换 成 准确 地 相似 于 B” 而 
不 是 召 的 矩阵 。 撼 阵 有 有 单 重 特征 值 1 十 10” 和 3， 从 10 位 计算 
的 观点 来 看 ,这 些 特 征 值 是 适当 分 离 的 ,并 且 有 3 个 独立 的 特征 向 
量 .这 样 计算 的 结果 ,我 们 可 以 宣称 特征 值 是 1 + 10”，1 一 10” 
和 3 十 10 ,并 且 对 应 的 特征 向 量 是 

1 1 10™* 

1+10 1 一 105 1 十 10 
1 一 10r9 1 一 102 1 
(我 们 料想 第 三 个 特征 值 及 特征 向 量 的 误差 是 10” 阶 ， 因 为 它们 


是 和 良 态 的 .) 
相应 的 剩余 矩阵 是 
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4 一 


1 1 
10°* 1 
0 0 


B’ (62.1) 


Tu] 一 {62.2) 


Erirars] 


10°% 0 一 1079 一 10 
一 2 10 一 2. 10 一 4 .109 一 "| (62.3) 
—10*+ 105 —10"—10 3 一 2 10 
注意 ， 虽 然 计 算 的 特征 系 有 10-* 玫 量 级 的 误差 ,但 是 剩余 矩阵 的 
分 量 却 是 10* 量 级 ， 一 般 说 来 ;对 于 用 稳定 的 方法 计算 的 特征 系 
是 会 这 样 。 事实 上 ,如 果 1 和 “对 (4 十 P) 是 准确 的 , 那 末 对 应 于 
4 的 剩余 向 量 就 是 一 Fx。 因此 , 它 依赖 于 F 的 大 小 。 

然而 , 当 我 们 设法 计算 UR 时 , 解 本 身 揭示 了 它 的 不 足 . 事 
实 上 ,我 们 有 


工 十 10 
U4U = 工 一 10 + F, (62.4) 
3 十 10 

这 里 , 记 10 一 x， 
了 一 C 十 

一 上 > 1 一 二 x+ 一 工 z—lxl] 

2 2 2 2 2 

1 1 1 1 (62.5) 

这 * 十 革 秆 要 x 十 却 f+ 一 了 

27 十 x —27—* | 


(lsal < 1079). 


我 们 看 到 。P 的 某 些 元 索 是 107” 阶 .在 这 种 情况 下 , 第 四 章 $ 69 
的 方法 , 给 出 误差 的 界 是 10"* 阶 的 解 ， 相 应 地 ,我 们 假定 了 161 


的 元 素 以 二 10* 为 界 . 


对 于 第 三 个 特征 值 。 Gerschgorin .定理 立刻 给 出 一 个 十 分 精 
确 的 界 . 我 们 用 10… 下 第 3 行 ,用 10’ 乘 第 3 列 ,此 时 Gerschgorin 
罗盘 是 分 离 的 ,并 且 第 三 个 贺 盘 有 
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中 心 (3 十 10 一 10 二 go)， 
半径 10-5(2 -102 一 1075 二 2 ，10-2 十 10-5 
十 |8| 十 [gal)， 


因此 ,尽管 我 们 的 特征 系 大 部 分 是 错误 的 ,但 是 我 们 定 出 了 它 在 中 


心 为 3 半径 小 于 6.10" 的 贺 盘 内 显然， 不作 进 一 步 的 计算 , 对 
其 他 两 个 特征 值 我 们 不 能 得 到 如 此 精确 的 界 。 


近似 的 不 变 子 空 间 


63. 豪 不 奇 低 ， 方 程 UP 一 R 的 解 比 R 大 得 多 因为 的 两 
列 实际 上 都 近似 于 对 应 4 一 1 的 唯一 的 特征 向 量 .运算 精度 越 高 ， 
口 越 变 得 接近 奇 蜡 ， 但 是 ， 我 们 得 到 的 第 三 个 特征 值 的 近似 信 却 
会 更 好 。 

假若 我 们 预先 知道 拭 阵 有 二 次 因子 的 话 ， 那 么 设法 计算 对 应 
于 这 个 二 重 特征 信 的 不 变 子 空间 就 更 令 人 注意 ， 我 们 说 ， 向 量 组 


Wy 2 所 


张 成 4 的 一 个 阶 不 变 子 空间 的 含义 ,是 4vi(i 一 1,.…,+) 沙 
在 这 同一 个 子 空间 内 。 最 简单 的 不 变 子 空间 是 由 对 应 于 单 重 特征 
值 的 一 个 特征 向 时 组 成 的 。 昌 然 ， 对 应 于 非 线 性 初等 因子 的 主 向 
量 张 成 一 个 不 变 子 空间 。 显 然 ， 对 应 于 4 一 1 的 特征 向 量 对 于 报 
动 是 敏感 的 ,但 是 ,它们 二 阶 的 不 变 子 空间 却 不 然 这 个 子 空间 由 
。 和 各 = 张 成 ,办 为 


Ae = e, Acy= et es 《63.1) 


$ 62 的 向 量 和 w， 都 可 以 表示 为 形式 we 十 ae 十 0(10 0)， 
因此 ,在 运算 精度 范围 内 ,它们 落 在 这 个 子 空间 内 . 可 是 办 和 和 
与 线性 相关 的 偏离 是 元 素 仅 为 DO(10-5) 的 向 量 。 因为 我 们 通常 
必须 认为 这 些 疝 量 在 十 进位 的 第 十 位 上 有 误差 , 因此 uu, 确定 
的 不 变 子 空间 不 能 达到 运算 精度 

另外 要 提 一 下 , 5$ 59 的 分 析 可 以 容易 地 推广 到 险 大 于 1 的 近 


192。 


似 的 不 变 子 空间 已 确定 的 情况 。 例 如 , 若 对 中 阶 矩 阵 4 有 


Am = ca 十 Got 十 ry 4 Gu TF Cat 十 3, 


(63.2) 
dus 一 pst r3y Lo Ps Fs 
那么 ， 
[ty 1, 二] 一 Tis, Ws ts ts] 
+ [ri, ra rs 74]» (63.3) 
用 简明 的 记号 写 为 
UAU = D+ UR. (63.4) 


县 不 谈 非 线性 初等 因子 的 情况 ， 我 们 常常 感 兴趣 的 是 实 和 矩阵 的 复 
共 孝 特征 向 量 对 张 成 的 二 阶 子 空间 . 设 向 量 对 是 w 土 iv。 其 中 ss 
v 是 实 的 ,那么 “，” 张 成 这 个 子 空 间 。 若 4 土 ip 是 对 应 的 特征 
值 ,我 们 有 

Alw + iv) = (0+ ip)(s + iv), 


从 而 
Au = hu — pv, 
Av= put tv (63.5) 
现在 回 到 4 62 的 简单 的 问题 . 如 果 我 们 企图 计算 一 个 不 变 子 


空间 来 代替 $ 62 的 m, wj， 我 们 可 能 得 到 (比如 说 》 
1+ 10-*11— 10" 
10-"{ 2410 | 
1—10%11— 109 


于 0 :109 
1 |+| 4 10n 2. 210 | 
二 一 5 10 3. 10° 


(63.7) 
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(63.6) 


lm, oo] 一 


并 且 有 


4[ms #3] 一 [un] 


Nl- bn 


因此 ， 剩 余 和 《〔62.3) 中 的 数量 级 相同 。 如 果 我 们 把 网 一 个 w 加 


进去 组 成 一 个 完整 的 UU， 那么 像 前 面 一 样 , 有 


ALmum}] = [muy] 


1 3 十 10 
-107% 一 107 一 10 


0 2 
十 | 一 4 10-% 2. 109 一 4 ,10 一 10 | (63.8) 
—5 +10- 3 .10-a —2. 10 
从 而 工 工 | 
2 2 
vAaU=| 1 1 
-全 上 
T1010 二 1 二 ,10 
2 | 2 
十 | 1 | TI10m_ .10-al 
| 0 5 .10 | 1 2.10 | 
一 5 +1016 .10-+ | 10-0 二 4.10-% | 
Ti10m— 2 .10% 
2 2 
1 1 十 G 63.9 
0 ， (639) 
一 1079 + 10 
基 中 


lent < 二 10™. 


现在 我 们 能 把 第 三 个 特征 全 确定 在 半径 为 0” 数量级 的 贺 盘 内 
并 且 能 更 精确 地 估计 其 他 的 特征 什 ， 
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几乎 正规 矩阵 


64. 在 第 二 章 $ 26 中 我 们 曾经 指出 , 以 a 条 件数 为 基础 的 误 
差分 析 对 于 相似 于 4， 例 如 
1 10 0 
0 1 9 
0 0 2 
的 矩阵 是 不 合适 的 。 这 个 矩阵 有 非 线性 初等 因子 ， 但 是 特征 值 是 
比较 不 敏感 的 自然 要 问 ， 解 这 样 的 矩阵 特征 值 问题 是 否 有 特殊 
困难 。 事 实 上 ， 在 实际 计算 中 这 种 矩阵 是 不 会 引起 麻烦 的 。 变 换 
后 的 矩阵 与 《4 十 下》 相似 ,一 般 说 来 , 它 没有 非 线性 因子 ， 而 是 
有 两 个 特征 值 《1 十 a10-*) 和 《1 -+ 810-*) 及 两 个 完全 独立 的 
对 应 的 特征 向 量 。 当 然 ， 根据 有 会 人 误差 的 计算 来 证 明 训 矩阵 有 
非 线性 因子 是 极其 困难 的 。 可 是 ,我 们 应 该 了 解 ， 里 然 多 重 特征 值 
常常 是 准确 的 整数 或 者 是 形 和 如 《x? + px 十 9) 的 因子 的 根 , 其 中 
,9 是 整数 , 但 是 ,只 要 有 会 人 误差 引入 ,用 这 样 的 方法 是 不 可 能 
去 证 实 一 个 矩阵 有 多 重 特征 值 的 ， 这 时 用 数值 方法 来 作 就 会 明白 
这 一 点 ， 


A= (64.1) 


附注 

首先 ， 对 定点 算术 运算 的 含 人 误差 作出 详尽 的 分 析 的 是 Von 
Neumann 和 Goldstine (1947)， 他 们 在 关于 甜 阵 的 朔 的 一 篇 竟 基 
性 的 论文 中 给 出 了 他 们 的 结果 。 他 们 用 的 记号 和 一 般 的 处 理 手法 
已 被 后 来 的 一 些 作者 采用 ， 

相应 的 浮 点 运算 的 分 析 首先 由 Wilkinson 在 1957 年 给 出 的 ， 
在 作 了 进一步 的 工作 后 于 1960 年 发 表 .结果 的 表达 形式 的 选择 是 
根据 我 们 的 看 法 ,我 们 确信 在 矩阵 问题 中 , 舍 人 误差 的 影响 最 好 用 
原 乱 阵 的 等 价 摄 动 来 表达 . 

5 55 的 结果 可 以 稍 作 改 进 如 下 。 对 任意 # 我 们 有 


Mv po — Av— prv tt (pg — pv = gt (pr — pr, (1) 


wl95s 


从 se 和 ”的 正 交 性 ,有 


和 hz 一 polB= s+ pe — pl = yy. (2) 
因此 ,在 中 心 为 “， 半 径 为 ? 的 圆 盘 内 至 少 存在 一 个 特征 倘 。 考 


不 满足 


?一 lm 一 p| 一 ^ 


(3) 


的 & 值 .这 样 的 值 对 应 的 仙 盘 与 中 心 为 kx 半径 为 < 的 六 冀 内 切 . 


因此 ， 在 后 一 圆 盘 内 唯一 的 特征 值 落 在 满足 


(3) 的 闫 为 中 心 的 每 


一 个 相应 的 圆 内 ， 因 而 落 在 其 并 集 之 中 。 这 个 并 集 显 然 是 中 心 为 
tn 半径 为 ?一 | pa 一 pg| 的 圆 盘 ,并 且 我 们 有 
y— lue— pl = (7 — lr oo pl /Cy + lin — pl) 


= gfe. 


(C4) 


因此 ,这 唯一 的 特征 值 是 在 中 心 为 ka 半径 为 sya 的 圆 盘 内 . 这 
一 结果 隐 仿 在 Bauer 和 Householder (1960) 的 论文 中 . 对 He- 
rmite 矩阵，Kato〈1949) 和 Temple (1952) 已 经 给 出 更 精细 的 


结果 。 在 实践 中 , (55.3) 中 额外 出 现 的 因子 


(1 一 Bfw) 是 不 重 


要 的 ,因为 这 个 结果 仅 当 = 显著 大 于 s 时 才 有 意义 ， 
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第 四 章 ”线性 代数 方程 组 的 解法 


引言 


1 在 本 书 所 属 从 书 的 姐妹 篇 (Fox，1964) 中 已 对 解 线性 代数 
方程 组 \ 求 逆 矩 阵 和 行列 式 计算 的 各 种 数值 方法 作 了 详尽 比较 ,但 
是 ,因为 我 们 经 常 要 涉及 这 些 问题 ,因此 有 必要 对 它们 再 作 进一步 
的 研究 .许多 我 们 必须 求解 的 方程 组 是 十 分 病态 的 。 充 分 认识 它 
的 含义 、 研 究 它们 的 解 是 十 分 重要 的 。 线 性 方程 组 的 研究 也 能 使 
我 们 在 考虑 相似 变换 之 前 从 较 简 单 的 单 边 等 价 变换 中 获得 有 关 误 
差分 析 及 稳定 性 研究 的 经 验 。 因 此， 我 们 首先 研究 有 哪些 因素 决 
定 线性 方程 组 


dx 一 三 (1.1) 
的 解 对 于 矩阵 4 和 右 端 5 的 改变 的 敏感 性 。 我 们 只 限于 考虑 4 是 
方 阵 的 方程 组 。 


摄 动 理论 


2. 我 们 首先 研究 (1.1) 的 解 对 于 “的 振动 的 敏感 性 。 如 果 ， 
政变 为 5 十 上 并 且 


A(x 十 和 二 5 十 高 (2.1) 
那么 减 去 (1.1) 就 得 到 
一 (2.2) 
下 一 4 二 (2.3) 
因此 ， 
fa 二 47 昌 。 (2.4) 


通常 ,我 们 还 对 相对 误差 感 兴趣 ,于 是 有 
Hal/ ad < AR AN el = AMAR 8. C2.5) 
这 说 明 14 册 4 由 可 以 看 作 是 这 个 问题 的 条 件数 ， 
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当 4 册 4 很 大 时 ,对 于 绝 大 多 数 右 端 & 和 摄 动 , 这 个 估 
计 都 是 十 分 悲观 的 。 对 绝 大 多 数 将 5 将 有 
lzll > IAsl. (2.6) 
但 总 存在 某 个 5 和 ,对 它们 来 说 (2.5) 是 符合 实际 的 。 
3. 现在 研究 4 的 摄 动 的 影响 我们 可 以 写 
(A+F)(r+h) -5, (3,1) 
这 给 出 
(4 十 下 ) —Fxr. {3.2) 
即使 4 不 是 奇异 的 (我 们 自然 这 样 候 定 ), 如 果 了 不 受 限 制 〈4 十 
PR) 可 能 是 奇异 的 。 写 出 


A+F=— A(+ A-'F), (3.3) 
我 们 看 到 如 果 
lA47Fl < 1, {3.4) 
那么 (4 十 F) 一 定 是 非 奇 蜡 的 ， 假 定 这 个 条 件 被 满足 ,我 们 有 
ho (+ AF) AT!Fz, (3.5) 
因此 ,根据 第 一 章 的 (56.3)， 站 人 人 7) 成 立 ,我 们 有 
leaps) < -LEI 
Wie < 1 mh 30 
EAEY < 1 (3.7) 


对 于 相对 误差 我 们 感 兴趣 的 是 用 IFI 州 41 来 表示 ziMizil 的 
菜 个 界 。 我 们 可 以 把 (3.6) 改写 为 


二 下 外 we 
lal ill < EAA ty 由 一 有 4 二 (3.8) 


这 里 又 一 次 说 明了 14I4- 是 决定 性 的 因素 。 最 常用 的 条 件数 
是 上 4 - 4- 昌 , 朋 常用 x(4) 表示 。 并 称 为 4 关于 逆 短 降 的 谱 
条 件数 。 现 在 ,我 们 从 第 二 章 530,531 小 出 ,给 阵 4 的 关于 它 的 特 
征 信 问 题 的 谱 条 件数 就 是 它 的 特征 向 量 矩阵 关于 逆 抵 隆 的 谱 条 件 
数 . 

在 推导 关系 式 〔3.6) 和 (3.8) 时 ,我 们 用 |4- 灿 Fi 代替 了 
HT4Pl， 总 存在 茶 些 振动 , 对 这 样 的 摄 动 ， 上 述 蔡 代 导出 的 结果 
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是 翡 观 的 ， 例 如 ,如 果 F 一 4， 那么 从 (3.6) 得 到 
Wal < -eh. (39) 
1— lal 
显然 , 它 与 条 件数 无 关 。 
条 件数 


省 谱 条 件数 < 关于 西 等 价 变换 是 不 变 的 ， 事 实 上 ， 若 尺 是 西 
和 矩阵, 并且 


B=RA, (4.1) 
则 有 

上 到 世上 有 下 = BRAINATR 一 HAA (4.2) 
叉 若 是 任意 数量 , 则 显然 有 


k(c4) = x(A). (4.3) 
这 是 一 个 合理 的 结果 ， 因 为 我 们 并 不 期 待 一 个 常数 乘 方程 组 两 边 
会 改变 方程 组 的 条 件 ， 从 定义 ,对 于 任何 矩阵 有 


A) 一 14 人 4 2 4 1 (4.4) 
如 果 4 是 酉 矩阵 的 若干 倍 , 则 等 号 成 立 
若 二 和 是 4 的 最 大 和 最 小 奇异 值 (第 一 章 ，$53); 那 么 
EC4) = fon; (4.5) 
当 4 是 对 称 和 矩阵 时 ,我 们 有 
«(A) = hf/ 1a, (4.6) 


其 中 aa ja 是 神 最 大 和 模 最 小 的 特征 值 ， 在 等 式 (4.5),(4.6) 中 
出 现 的 比率 常常 令 人 迷惑 ， 我 们 必须 认识 到 其 中 的 分 子 纯粹 是 规 
范 化 的 因子 . 

如 果 我 们 取得 14l; 一 1 这 总 可 以 用 一 个 适当 的 常数 乘 方程 

组 4x 一 5 来 达到 ,那么 
xA) 一 下 dpi4 一 Ho (4.7) 
一 1/141( 如 果 4 是 对 称 的 ). (4.8) 
因此 , 当 且 仅 当 上 4 浊 大 ,也 就 是 "。 小 的 情况 下 ,在 对 称 矩阵 的 
情况 下 就 是 小 时 ， 一 个 规范 化 矩阵 4 才 是 病 坟 的。 在 用 * 作 
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为 条 件数 时 ， 我 们 的 合意 是 ， 一 个 规范 化 的 矩阵 、 如 果 它 的 逆 是 
“大 ”的 , 它 就 是 病态 的 ， 这 是 与 一 般 的 病态 的 概念 一 致 的 , 因为 在 
右 端的 微小 改变 能 导致 解 的 大 的 变动 。 


平衡 矩阵 


5. 一 个 正 交 甜 阵 不 仅 是 规范 化 的 ， 而 且 它 的 所 有 行 和 询 的 长 
度 都 是 1。 显 然 ,一 般 的 规范 化 矩阵 并 不 如 此 .假如 我 们 用 10 乘 
一 正 交 和 矩阵 的 第 " 列 ， 得 到 矩阵 了 。 和 矩阵 B78 除了 第 7 个 对 角 
线 元 素 是 10” 之 外 是 单位 矩阵 ,因此 Bll 一 1. B 的 逆 是 10" 莱 
以 全 的 第 ” 行 所 得 的 矩阵 .因此 ,B-(B-97 除了 它 的 第 " 个 对 
角 线 元 素 是 10” 之 外 是 单位 矩阵 。 因 此 ，11B -小 一 10"， 所 以 ， 
如 ) = BilB hs 一 10°, (5.1) 
如 有 果 我 们 用 10-" 秉 正 交 矩阵 的 任 一 行 ， 那 么 我 们 得 到 同样 的 结 
果 . 
每 一 行 和 每 一 列 的 长 度 都 是 1 的 数量 级 的 矩阵 称 为 平衡 抵 
阵 ， 我 们 不 是 在 十 分 精确 的 意义 下 使 用 这 个 术语 ， 而 最 普通 的 是 
指 这 样 的 矩阵 ， 它 的 每 一 个 元 素 都 沾 于 1, 所 有 的 行 、 列 都 引进 了 


比例 因子 使 得 至 少 有 一 个 元 素 的 模 在 1 和 1 之 间 。 在 引信 比例 
因子 时 ,为 了 避免 伟人 误差 通常 是 用 2 或 者 10 的 短 ; 如果 矩 阵 是 
对 称 的 ,引进 比例 因子 要 保持 其 对 称 性 , 因而 只 满足 于 保证 每 一 列 
包含 一 个 模 大 于 到 的 元 素 . 如 果 一 个 平衡 矩阵 4 的 任 一 行 或 者 
烈 被 乘 以 10-"， 那么 得 到 的 矩阵 刀 必 定 有 很 高 的 条 件数 . 事实 
上 ，B87 的 最 大 特征 值 of 大 于 它 的 最 大 的 对 角 线 元 素 ; 它 的 最 
小 特征 值 o% 小 于 它 的 最 小 的 对 角 线 元 素 。 因此 ，q? 必 是 大 于 
3+, 而 中 小 于 10-zw ,于 是 
x(B) > 10°/ (2n2). (5.2) 
注意 ,不 管 扫 的 条 件数 是 多 少 这 个 结果 都 成 立 . 
6. 我 们 自然 会 问 ， 以 这 种 方式 从 一 个 良 态 的 矩阵 4 得 到 的 矩 


200。 


阵 史 是 否 确实 是 病态 的 。 回答 这 个 问题 的 困难 在 于 ， 我 们 在 通俗 
的 意义 下 和 精确 地 定义 的 数学 意义 下 都 同样 使 用 “病态 ”这 个 术 
语 . 如 果 我 们 定义 “为 矩阵 的 杀 竹 数 , 那 么 毫 无 疑问 55 的 被 修改 
的 正 交 逢 阵 是 十 分 病 赤 的。 然而 ,在 通俗 的 意义 下 ,如 果 计 算 的 解 
没有 实际 意义 ， 我 们 才 说 方程 组 是 病态 的 .不 考察 系数 是 怎样 导 
出 的 ,我 们 就 不 能 判定 方程 是 否 是 病态 的 。 


简单 的 实际 例子 


7. 我 们 考虑 一 个 简单 的 例子 ,一 个 二 阶 的 线性 方程 组 , 它 的 系 
数 和 矩阵 4 是 这 样 确定 的 : 每 个 元 素 都 用 测量 三 个 独立 的 在 土 1 
范围 内 的 量 加 在 一 起 得 来 的 ， 假 定 每 次 测量 的 误差 是 10” 数量 
级 ， 而 所 得 到 的 和 矩阵 是 
1.00000 0.00001 
[oo000 —0.00001 ] 5 
在 计算 第 二 列 的 元 素 时 已 发 生 了 相约 , 如 果 用 10” 乘 它 的 第 二 列 ， 
这 个 矩阵 就 变 成 正 交 和 矩阵 的 二 偿 。 显 然 , 在 计算 的 解 可 能 没有 有 
效 数字 的 意义 下 ,这 个 方程 组 也 病态 的 ， 

现在 考虑 第 二 种 情况 , 二 阶 矩阵 的 元 素 是 由 精度 10 分 之 一 
的 一 次 测量 得 来 的 。 假 如 第 二 列 元 素 的 测量 单位 比 第 一 列 的 大 得 
多 ,我 们 可 能 又 得 到 矩阵 《7.1)， 但 是 现在 计算 的 解 可 以 是 完全 有 
效 的 。 

如 果 和 矩阵 的 元 素 是 用 带 有 伟人 误差 的 方法 按照 数学 表达 式 计 
算 的 ， 可 作 类 似 的 讨论 ， 有 两 种 情形 ， 一 种 情形 是 (7.1) 类 型 的 
矩阵 中 第 二 个 列 的 小 元 素 是 大 小 几乎 相等 符号 相反 的 数 相约 得 出 
的 ; 另 一 种 情形 是 这 些 元 素 有 高 的 相对 精度 。 这 两 种 情形 的 差别 
可 能 是 很 大 的 . 


特征 向 量 矩 阵 的 条 件 


8. 在 第 二 章 中 ， 我 们 讨论 了 列 等 于 给 定 气 阵 的 规范 化 右 特征 
向 量 的 矩 伐 的 条 件 ， 这 种 矩阵 不 可 能 有 小 元 素 组 成 的 列 。 但 是 整 
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行 都 是 小 的 倒 有 可 能 ， 如 果真 是 这 样 ， 特 征 向 量 必 定 是 几乎 线性 
相关 的 ， 因 而 息 应 的 特征 值 问 题 会 是 病态 的 ， 把 这 样 的 特征 向 县 
撼 阵 看 作 病态 显然 是 “正确 的 "， 在 这 种 情况 下 ， 在 对 于 求 它 的 逆 
来 得 到 在 特征 向 量 系 之 前 ,用 2 (或 者 10) 的 每 去 乘 那些 不 好 的 行 
来 平衡 这 个 矩阵 仍 有 不 少 问 题 要 讨论 ， 然 后 计算 的 道 必须 由 同样 
的 2 (或 者 10) 的 震 乘 以 对 应 的 列 , 以 给 出 真正 的 逆 . 

9. 我们 看 出 在 通俗 意义 下 线性 方程 组 的 条 件 是 很 主观 的 . 在 
实际 上 ， 与 方程 组 求解 有 关 的 计算 问题 的 条 件 才 是 重要 的 ， 在 本 
章 中 讨论 的 某 些 技术 对 于 平衡 矩阵 是 最 适合 的 ， 因 为 我 们 不 时 要 
作 的 判定 是 根据 矩阵 元 素 的 相对 大 小 的 ， 由 于 在 绝 大 多 数 情况 下 
我 们 用 平衡 方法 都 是 使 矩阵 的 条 件数 减 小 ,所 以 它 显 得 强 有 力 .如 
果 我 们 用 浮 点 运算 ,那么 规范 化 与 平衡 不 同 ,不 起 任何 实质 性 的 作 
用 .尽管 如 此 ,规范 化 的 假定 还 是 简化 了 讨论 ,而 不 失 一 般 性 . 

如 果 在 严格 的 意义 下 矩阵 被 平衡 和 规范 化 ， 那 么 即使 我 们 包 


括 了 对 称 的 平衡 ,4 也 是 落 在 二 和 "之 则 ,并 且 通 个 是 哇 数 
最 级 .因此 除了 对 于 十 分 大 的 矩阵 之 外 , 4- 员 《或 者 4-: 的 极 
大 模 的 元 素 ) 是 一 个 适当 的 条 件数 、 因 为 4-: 的 第 > 列 是 4z 一 


er 的 解 ， 显然 , 当 且 仅 当 存在 一 个 规范 化 的 “使 得 4z = 5 的 解 
有 大 的 范 数 ,规范 化 的 平衡 矩阵 才 是 病态 的 。 


显 式 解 


10. 如 果 4 有 线性 的 初等 因子 ， 我 们 能 得 到 方程 4x 一 b 的 
一 个 简单 的 显 式 解 ， 事 实 上 ,如 果 我 们 写 
x Egixis (10.1) 
其 中 履 形 成 4 的 完备 的 规范 化 特征 向 量 组 ,那么 
Baxi = b, (10.2) 
因此 ,如 果 》; 是 个 的 对 应 的 特征 商量 ,我 们 有 
«= VO) = YCms0)™, (10.3) 
从 (10.1) 和 (10.3) 我 们 有 
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lx < 2lollial = Blol < 所 二 |asl (10.4} 
除 至 少 有 有 一 个 了 4( 或 了 者 ) 是 小 的 项 则 我 们 不 可 能 大 抑 
短 ， 如 果 4 是 对 称 的 , 那么 所 有 5 都 是 1， 除 非 4 有 小 的 特征 值 , 
否则 4 不 可 能 是 病态 的 ， 这 与 我 们 以 前 得 到 的 结果 一 致 . 


对 矩阵 过 件 的 总 评述 


11. 一 个 没有 小 特征 值 规范 化 的 非 对 称 矩 阵 可 能 是 十 分 病态 
的 .认识 到 这 一 点 是 重要 的 。 例如, 下面 给 出 的 100 阶 方程 组 


0.501 一 1 0 

0.502 ”一 1 0 
ee =| (GD 

0.599 一 1 0 

0.600 1 


它 的 解 的 第 一 个 分 景 是 
a= 1/(0.600 X 0.599 xX + xX 0.501) > (0.6)-® > 1 
(112) 
因此 ,系数 矩阵 的 逆 的 范 数 必定 大 于 10%"。 然 而 , 它 的 最 小 的 特征 
值 是 0.501， 这 个 矩阵 必定 有 一 个 数量 级 是 10-” 的 奇异 值 . 
另 一 方面 ,规范 化 的 矩阵 具有 小 特征 值 必 然 意 味 着 是 病态 的 . 
事实 上 ,我 们 有 
14- 业 关 14 的 最 大 特征 值 1 一 l/mini%l。 (11.3) 
最 后 ,具有 小 的 5 并 不 必然 意味 着 病态 ， 第 二 章 〈26.6) 的 矩阵 可 
以 说 明 这 一 点 ,那个 矩阵 有 10"" 量 级 的 ,但 是 它 的 逆 是 


一 0 0 


0 1 Ut -10 (11.4) 
0 0 HU+x) 
现在 讨论 有 非 线 性 初 等 因子 的 矩阵 。 我 们 从 和 矩阵 


4=-[: | (11.5) 
看 出 ， 非 线性 因子 不 一 定 意味 着 病态 。 另 一 方面 ， 如 果 我 们 用 
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0.500 代替 (11.1) 中 的 所 有 对 角 线 元 素 , 那 么 矩阵 变 得 更 加 病态 ， 
并 且 有 一 个 100 次 的 初等 因子 。 

这 些 考虑 表明 ， 虽 然 和 矩阵 关于 特征 值 问题 的 条 件 和 关于 求 北 
的 条 件 是 完全 不 同 的 事情 ,但 是 它们 不 是 完全 没有 关系 的 ， 


病态 和 几乎 奇异 的 关系 


12. 如 果 和 矩阵 是 奇异 的 ,那么 它 至 少 有 一 个 零 特 征 值 ， 因 为 它 
的 全 部 特征 值 的 乘积 等 于 它 的 行列 式 。 人 们 自然 会 设想 奇异 性 是 
病态 的 极端 形式 ， 并 且 导 致 病态 的 规范 矩阵 必定 有 一 个 小 特征 值 
的 结论 。 刚才 我 们 已 经 看 到 ,这 个 结论 是 不 对 的 ,但 是 考 卉 为 什么 
利用 这 个 极限 过 程 会 导致 刻 误 是 有 益 的 
现在 我 们 证 明 , 和 如果” 固定 ， 并且 14 一 1, 4 的 模 最 小 的 
特征 值 41。 当 147 趾 趋向 无 穷 时 确实 是 趋向 于 零 . 但 是 ,我 们 只 
能 保证 收 剑 是 十 分 慢 的 .对 于 任何 矩阵 4 存在 西 矩 阵 丸 使 得 
RE4R 一 diag(2) 十 了 一 六 十 了 ， 《12.1 
其 中 了 是 严格 上 三 角形 的 (参见 第 三 章 ,847)， 因 此 我 们 有 
RHA"R = (D+ TT) 
=[I—K+tR— (ol) KR DT!, {12.2) 
其 中 KK 一 D7 
因为 K 是 严格 的 三 角形 的 ,因此 K' 一 Mr #). 对 于 我 们 的 证 
明 , 一 个 十 分 粗糙 的 界 就 足够 了 ， 我 们 有 
ITh <lTls < ID + The = Als < ndilAlh = a (12,3) 


和 
I < phlTh < 0#/ 17, (12.4) 
其 中 1 是 模 最 小 的 特征 值 ， 因 此 ,从 (12.2) 有 
HA 一 REA™RI < (1 + nt/ 121 + Cod/ 42) 
二) | (12.5) 


EAC /Pn (12.6) 


204. 


无 疑 ， 这 证 明了 ,固定 #, 当 4 地 趋 于 无 穷 时 , 4 趋向 于 堆 ， 但 是 
这 里 涉及 了 十 的 筹 次 。 我 们 讨论 的 例子 证 明了 这 个 界 就 其 因子 
147! 陪 来 说 是 十 分 逼真 的 。 我 们 可 以 构造 一 个 100 阶 的 规范 化 
算 阵 ,其 条 件数 量 是 2” 量 级 , 但 是 它 没有 一 个 特征 值 小 于 0.5. 

t 位 运算 的 限制 


13. 如 果 方 程 
Ax—b (13.1) 
的 4 和 2 需要 多 于 * 位 来 表示 ， 那 么 我 们 应 该 满足 于 有 + 位 的 近 
位 的 4 和 如 我们 有 


A=AtF, b=b+tt, (13.2) 
其 中 对 于 定点 计算 ， 
| 加 | 所 地 2， | 系 寺 2 (13.3) 
因此 ， 
Hb 和 < 二 2 IRb < 二 2 -5 (13.4) 


显然 上 界 是 可 以 达到 的 。 从 《3.7) 看 出 除非 
1 Te 
"4 <1, 


否则 矩阵 (4 十 F) 可 能 是 奇异 的 ， 如 果 这 个 条 件 得 到 满足 ,简单 
的 运算 表明 ，4'z' 一 ”的 准确 解 满足 
lz’ ~ zl < Ab LE ll + A471 — Al El). 
(13.5) 
显然 ,除非 "2 4- 业 明显 小 于 1， 否 则 初始 误差 可 能 完全 破坏 
解 的 糖度 。 类 似 地 ,对 于 浮 点 运算 我 们 有 
tal 271enl, lhl e277 bl, (13.6) 
IlFlh < iFls < 274ls < 2 二 4 用， S27. (13.7) 
14. 现 在 我 们 研究 计算 中 间 产 生 的 合 人 误差 。 考 虑 定点 运算 ， 
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数 用 # 位 表示 时 ,用 一 个 二 和 1 之 闻 的 常数 。 科 方程 组 的 影响 ， 
如 果 我 们 全 人 所 得 的 结果 ， 方 程 组 变 为 
(cA+F)x*—cbtK, 
lal < 袜 寺 2 (14.1) 


变换 后 的 这 个 方程 组 完全 等 价 于 
(A+ Flier =6 + he, 《14.2) 
因此 , 合 人 误差 分 别 等 价 于 在 4 和 上 的 摄 动 Fjc 和 Kjc, 它 的 
界 是 初始 合 人 的 界 的 1/¢ 倍 。 大 多 数 解 方程 的 直接 法 中 ， 典 型 的 
步 是 把 一 个 方程 的 若干 倍加 到 另 一 个 方程 上 。 因 为 即使 对 一 个 
适当 阶 数 的 矩阵 也 有 许多 这 样 的 步 ， 我 们 也 许 会 设想 这 些 步 产生 
的 爹 人 误差 的 总 和 对 解 的 精度 的 损害 会 比方 程 (14.1) 一 次 运算 严 
重 得 多 . 一 个 令 人 感到 惊奇 的 事实 是 ， 一 个 最 简单 的 解法 通常 导 
臻 的 误差 恰恰 就 是 由 满足 方程 (13.3) 的 随机 报 动 F 和 得 出 的 误 
差 的 期 望 值 。 这 意味 着 , 当 原 矩阵 的 元 素 不 能 用 * 位 数字 表示 时 ， 
这 个 从 初始 伟人 产生 的 误差 可 能 和 解 的 过 程 中 所 有 的 步 产生 的 误 
差 一 样 严重 。 更 依 人 的 事实 是 ,对 于 某 些 十 分 病态 的 矩阵 ,初始 舍 
人 有 更 严重 的 影响 ( 见 $40 和 $45)。 


解 线性 方程 组 的 算法 


15. 我 们 只 对 线性 方程 组 的 直接 解法 感 兴趣 ,并 且 我 们 用 的 所 
有 稀 法 都 采用 相同 的 基本 策略 . 设 4 是 ”x 4 短 阵 , * 是 方程 
Ar=b (15.1) 


的 解 ,那么 它 也 是 方程 

PAr= Pb (15.2) 
的 解 ,其 中 了 是 任意 的 mX = 抵 阵 。 如 果 ? 是 方 阵 并 且 是 非 奇异 
的 ,那么 (15.2) 的 解 是 (15.1) 的 解 。 反 之 亦 然 。 更 进一步 ,如果 
也 是 非 奇异 的 ,并 且 ? 是 

PAQY ~ Ph (15.3) 
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的 滔 , 那 么 9y 是 (15.1) 的 解 ( 见 第 一 章 ,815)。 有 些 算法 利用 这 个 
结果 ,9 为 置换 矩阵 、( 第 一 章 ,S40GD) 

基本 的 策略 是 决定 一 个 简单 的 非 奇 异 矩 隆 了 使 得 P4 是 上 三 
角 弄 ， 因 为 第 ”个 方程 只 含有 x。; 第 (z 一 1) 个 方程 只 含有 x 和 
:等 等 …, 因 此 (15.2) 方程 组 可 以 立刻 求解 ， 变 量 可 以 一 个 搓 
着 一 个 按 次 序 x x4，…， 1 决定 ， 这 种 上 三 角形 系数 逢 降 的 
方程 组 解法 通常 称 为 向 后 回 代 ， 

简化 矩阵 4 为 三 角 型 是 我 们 讨论 的 重要 问题 之 一 ， 在 不 需 赛 
作 向 后 回 代 的 情况 下 也 是 重要 的 ， 因 此 现在 我 们 先 集中 考虑 三 角 
形 化 。 

我 们 讨论 的 算法 通常 由 ( 一 1) 步 组 成 ,都 有 如 下 共同 的 特 
点 . 记 


Lor 一 名 (15.4) 
为 初始 的 方程 组 .每 一 步 产 生 一 个 等 价 于 原 方程 组 的 新 的 方程 
组 . 记 

Apr 一 加 (15.5) 
为 第 ? 步 的 等 价 方 程 组 。， 这 些 算法 的 基本 特点 是 4; 的 前 ? 列 已 
经 是 上 三 角 型 . 当 n ~ 6,p 一 3, 方程 4px 一 bp 的 形式 是 


p np 
一 ~、 , 
xx x x x xlx x 
pilo x x x x x|ix x 
00x x x xxl x 
一 ， 《15.6) 
000 XXXHm x 
np 0 00 Xx x x|lx, x 
000 x x xjlix x 


其 中 x 号 表示 一 般 是 非 零 的 元 素 。 按照 习惯 我 们 省 去 列 向 量 * 和 
等 号 仅 用 和 矩阵 (4*j2r) 来 表示 。 

第 + 步 是 确定 初等 矩阵 P,, 使 得 由 Pr4,-， 定 义 的 4, 的 前 + 
列 是 上 三 角 型 , 它 的 前 《* 一 1) 行 和 列 与 4,., 的 相同 。 因 此 ,这 
一 步 保持 前 (r 一 1!) 个 方程 完全 不 变 ， 第 + 个 变换 定义 的 方程 是 
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如 一 中 4 PE (15.7) 
显然 ，P,4s- 的 第 > 列 是 
人 
p, 人 ， (15.8) 
本 
并 且 必 须 选择 P, 使 得 e323.…a5 化 为 办 而 afr* 到 egib 不 
变 。 这 恰巧 就 是 第 三 章 中 考虑 基本 的 误差 分 析 时 已 讨论 过 的 阿 
是 本章 的 其 余部 分 主要 是 致力 于 讨论 有 关 的 算法 ， 


Gauss 消去 法 


16. 如 果 我 们 到 和 矩阵 P, 为 初等 矩阵 N, (第 一 章 ,$40(vi)), 其 
元 素 是 


1 《16.1) 
我 们 得 到 最 简单 的 算法 。 除 数 o8-” 称 为 第 ” 主 元 或 主 元 素 ， 用 
N: 左 很 的 结果 是 ,对 于 守 从 (r 十 1) 到 n, 第 : 行 减 去 第 行 的 srv 
倍 。 选 择 的 乘 数 是 使 第 列 的 最 后 (” 一 >) 个 元 素 化 为 零 .对 右 
端 5 我 们 进行 同样 的 运算 .显然 ,第 1 行 到 第 (> 一 1) 行 不 变 ， 
而 且 在 前 (+ 一 1) 列 中 没有 一 个 零 元 素 受 到 影响 , 因为 每 一 个 都 是 
零 元 素 的 线性 组 含 。 用 这 个 算法 第 * 行 也 不 变 ， 读者 会 发 现 ， 这 
个 方法 是 中 学 代数 教程 中 消去 法 的 系统 化 形式 .事实 上 ,第 + 个 
方程 是 用 来 消去 dr-ix 一 如 - 的 第 (> 十 1) 个 到 第 ”个 方程 中 的 
x 这 个 算法 通常 称 为 《Gauss) 消去 法 . 


三 角形 分 解 
17. 对 于 7+ 一 1 到 "一 1 逐次 应 用 方程 (15.7) 和 P, 一 N,, 我 
们 有 
Naa NNAo = Asis Ne NNbo = bo (17.1) 
前 一 个 等 式 给 出 
NTNT Nd 一 Nd-o( 第 一 章 站 40,41)(17.2) 
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其 中 心 是 下 三 角形 矩阵 ， 其 对 角 元 素 是 1。 对 角 线 以 下 的 元 素 是 
《16.1) 定 义 的 ao， 在 Ni' 的 乘积 中 没有 mr 的 乘积 出 现 。 因此 
Gauss 消去 法 产生 一 个 单位 下 三 角形 矩阵 w 和 一 个 上 三 角形 矩阵 
As-!,， 其 乘积 等 于 如 

如 果 么 能 表示 为 这 梓 的 熏 积 ( 见 6207, 并 且 是 非 厅 的 ， 邢 
委 计 个 下 未 式 如 家- 的 ， 训 实 上 ,如 果 


do— LD = LiUs, {17.3) 
其 中 L: 是 单位 下 三 角 型 并 且 Z 是 上 三 角 型 。 那 么 ,六 为 
det( do) = det( Ls) Get( Ds), (17.4) 
DV 不 可 能 是 否 异 的 。 因 此 (17.3) 给 出 
Li = DT (17.5) 


左边 的 矩 血 是 两 个 单位 下 三 角 型 的 乘积 ,因此 是 单位 下 三 角 型 , 然 
而 右边 的 矩阵 是 上 三 角 型 ， 因 此 两边 都 必定 是 单位 矩阵 ， 从 而 有 
b= UU. 


三 角形 分 解 矩阵 的 结构 


18.。 4osN，4s- 的 各 个 子 矩 阵 和 中 间 的 4, 之 间 的 关系 对 于 
今后 的 应 用 十 分 重要 .我 们 对 这 些 矩 笑 作 相同 的 分 块 


其 中 有 足 标 i,i 的 矩阵 有 i 行 , i 行 。 当 我 们 不 想 强调 矩阵 与 执行 
算法 的 关系 时 ,我 们 将 分 别称 N 和 <4e-: 为 二 和 Z. 《18.2) 中 的 记 
号 反映 了 4, 的 前 ” 行 在 以 后 各 步 运算 中 保持 不 变 的 特点 , 可 是 我 
们 已 看 到 ,在 后 面 的 这 些 步 中 4, 的 第 (r 十 1) 行 也 不 变 。 因 此 ， 
De-， 和 Won-, 的 第 一 行 也 恒 等 。 
由 前 " 步 我 们 有 
Ne Never dr 
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从 Ni 的 乘法 的 性 质 { 第 一 章 $41) 得 出 
A = NINF'e NA = | | 2- | A (18.3) 


对 (17.2) 作 相间 的 划分 ,我 们 得 到 
A 一 三 rrrsdrnrr 一世 Cross 
Aaer = Lar As-nar = LonUrn-s (18.4) 


十 Lore-r Us-m-e. 


而 从 (18.3) 最 后 的 一 块 得 到 

Massa = LanceUsnr tt We-nas, (18.5) 
上 上 述 五 个 方程 给 我 们 很 多 信息 。 第 一 个 方程 表明 LwUw 是 如 的 
+ 阶 前 主子 矩阵 4w 的 三 角形 分 解 。 所 以 在 执行 Gauss 消去 法 
过 程 中 依次 得 到 4。 的 + 阶 前 主子 矩阵 的 两 个 三 角形 是 最 终 的 三 
角 型 和 4。- 的 前 主子 矩阵 . 《18.4) 的 最 后 一 个 方程 和 (18.5) 
表明 


了 rm- 了 -sr 一 Wa-ra-s (18.6) 
因此 ，Ls-na-Us-ro-r 是 4 的 在 下 角 的 (2 一 +) 阶 方 阵 的 三 角 
形 分 解 。 


三 角形 算 阵 元 泰 的 显 式 表 达 式 


19. 方 程 (18.4) 使 我 们 能 利用 如 的 子 式 得 到 入 和 4。-: 的 元 
素 的 显 式 表 达 式 ， 这 些 结果 我 们 以 后 要 用 到 。 结 合 第 一 个 和 第 三 


个 方程 ,我 们 得 到 
Am Lr 
| : | -| 了 | {19.1) 
Mer Lanr 


对 方程 两边 第 一 行 至 第 一 1 行 以 及 第 行列 等 式 ,我 们 得 到 

4r LoUnli mm 1 {19.2) 
其 中 dz 表示 由 如 的 前 > 列 的 前 (7 一 1) 行 和 第 i 行 组 成 的 矩 
阵 ， 对 Zir 有 类 似 的 定义 。 因为 L;, 和 Lm 的 前 (x 一 0 行 相 
等 ,所 以 它 必 定 是 三 角 型 。 于 是 
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det(Lir) = li (19.3) 


因此 ， 

det( 41,) = hidet(Un). (19.4) 
当 i =+ 时 、 

det(An) 一 det{ Uy). {19.5) 
因此 ， 


Mie = ir detCAsr)/ det A) (i = 1) (19.6) 
注 淹 ,对 于 i 之 r, det(A1) 一 0《 因 为 4i 有 两 行 恒 等 )。 这 与 N 
的 三 角 型 的 竹 质 一致 , 


类 似 地 ， 
[Anidner] ~ Lr UU sl, {19,7) 
采用 相应 的 记号 ,有 
A = LrUn, {19.8) 
从 而 ， 
det{ An) = det(U) (i = 1, 0)。 (19.9) 
Uw 和 Un 的 前 (7 一 1) 列 相等 ,所 以 它 必定 是 三 角 型 。 因 此 ， 
det(A41) 一 det(Upnr a ur (19.10) 


《19.5) 中 > 以 ”一 工 代 ,(19.10) 与 (19.5) 结合 可 得 
un 一 det(An)/ det(Arsr) Gls). 《19.10 
特别 地 ， 
位 一 det(4m)1det(dr-rDtr > 1), 


fa 一 gr 。 


(19.12) 


在 (18.3) 的 前 面 我 们 已 经 说明 ，wrsravr 是 Wr-t 的 (1,1) 元 
素 ,而 (19.12) 表 了 明 它 等 于 
det(Astsris) det( Am). 

对 于 方 阵 矿 ,-n-, 的 其 它 元 素 我 们 能 得 到 类 似 的 表达 式 。 为 简 
明 起 见 , 当 ?7 > > 时 记 wi 为 4, 的 (i, 站 元素, 这 些 元 素 组 成 
了 有 sra- 从 4 推导 4, 时， 仅仅 是 第 1 行 到 第 7 行 的 倍数 加 
到 其 他 行 上 ， 因 此 任 一 个 包含 第 工行 到 第 行 的 每 一 行 的 子 式 是 
不 变 的 。 现在 我 们 研究 一 个 取 自 第 1 到 第 : 行 以 及 第 i 行 ， 自 第 
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1 到 第 ” 列 以 及 第 ; 列 的 子 式 4wwii。 这 个 子 式 的 什 不 变 ， 并且 
从 4, 的 结构 可 知 它 等 于 det(Zw)jwif。， 因此 我 们 得 到 

det( Asis3) = det(Un) wiis (19.13) 
并 且 从 (19.5) 得 到 

wii 一 det(Amii) /det(Am), (19.14) 
我 们 得 到 weyiwrr, 的 值 只 不 过 是 (19.14) 的 一 个 特例 ;这 是 不 奇怪 
的 ， 因 为 直到 wiv， 作为 主 元 素 之 前 ，W。-,.a-， 的 全 部 元 素 都 
处 于 同样 的 状态 。 我 们 现在 已 得 到 了 4, 和 NN 的 全 部 元 素 的 显 式 
表达 式 。 


Gauss 消去 法 的 中 断 


20. 我 们 已 得 到 的 4, 和 NN 的 元 素 的 表达 式 是 以 Gsuss 消去 
潜能 实际 执行 的 假设 为 基础 的 。 可 是 ,如 果 1 阶 到 {n 一 1) 阶 前 主 
子 式 都 不 为 零 , 从 (19.13) 知道 ,所 有 主 元 不 为 零 , 此 时 算法 才 不 会 
失败 . 注意 ,我 们 不 管 det(4o) ( 即 det(4o)) 是 否 为 零 ， 

假定 第 一 个 零 主 元 素 是 在 (* 十 1) 步 出 现 ,结果 前 7 个 前 主子 
式 不 为 零 而 det(4iurr 等 于 零 。 从 (19.6)， 藻 对 某 个 大 于 "” 十 
1 的 i，det(Ai.ntt) 天 0 算法 就 失败 ,因为 w+ 将 是 无 穷 大 。 可 
是 ,如果 det(4ivrD 一 0G 一 了 十 1 7), 那 么 所 有 min 都 不 
能 确定 。 在 这 种 情况 下 ，wiwmr 可 以 取 任 何 值 ， 特 别 地 , 令 它们 为 
零 , 则 得 到 Ny 一 1， 并 且 第 (r 二 1) 步 保持 4, 不 变 ， 

事实 上 ,在 这 种 情况 下 ,如 果 我 们 注意 到 
orH 一 Arkte 《20.17 
从 (19.14) 可 以 看 出 权 。--， 的 第 一 列 已 经 是 零 。 此 外 ，4 的 前 
《r 十 1) 列 的 秩 显 然 是 +， 这 表明 它们 是 线性 相关 的 。 但 是 ， 这 
(r 十 攻 列 可 以 用 非 奇异 矩阵 左 冬 46 的 同样 的 列 得 到 ,因此 4 的 
这 些 列 也 必定 是 线性 相关 的 。 所 以 如 是 奇异 的 并 且 仅 当 5 满足 
rank(4o) 一 rank 《Aoib) 时 ，Azx 一 了 才 有 解 ， 如 果 方 程 是 不 相 
容 的 ,在 回 代 时 当 我 们 用 零 主 元 作 除 法 去 计算 ”+ 时 不 相 容 性 就 
显示 由 来 了 。 如果 它们 是 相 容 的 ,那么 zxr+k 将 是 不 定 的 。 
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注意 ， 消 去 过 程 的 中 断 与 矩阵 的 奇异 性 或 病态 一 般 是 不 相关 
的 。 例 如 ,如 果 4。 是 
0 1 
[， 中 ， 


那么 Gaus 消去 法 第 一 步 就 失败 ， 但 是 4 是 正 交 矩 阵 , 是 良 态 
的 。 


数值 稳定 性 


21. 到 目前 为 止 ， 我 们 仅仅 考 忠 了 消去 过 程 发 生 中 断 的 可 能 
人 性。 可 是 ,如 果 我 们 从 计算 的 角度 来 考 工 ,那么 当 某 些 or 大 时 ,这 
个 过 程 是 数值 不 稳定 的 ， 为 了 克服 这 个 困难 ,我 们 可 用 第 三 章 547 
叙述 的 稳定 的 初等 矩阵 N; 代替 N,。 在 第 ” 步 我 们 用 Nrl 作 雪 
法 ,其 中 ” 由 下 式 确定 


laszsd| 一 max ja (21.1) 


如 果 这 样 确定 的 ' 不 唯一 ,我 们 取 它 的 所 有 可 能 的 值 中 最 小 的 一 
个 。 

用 Tv 左 乘 的 结果 是 第 * 行 与 第 r 行 交 换 (其 中 "> +)， 
接着 用 N, 左 乘 的 结果 是 第 《〈r 十 1) 行 到 第 ” 行 依次 减 去 新 的 第 
7 行 的 倍数 ， 并 且 所 有 的 乖 子 的 寞 都 小 于 1。 在 第 " 步 中 第 1 行 
到 第 (7 一 D 行 保持 不 变 , 并 且 以 前 引进 的 零 元 也 保持 为 零 。 对 这 
个 修正 的 过 程 ,我 们 有 

Ay = Na {21.2) 

在 每 一 阶段 这 个 稳 定 的 过 程 是 唯 ~- 确定 的 ， 除 非 在 第 ， 步 开 
始 时 图 -一 00 一 rm) 此 时 我 们 的 规则 是 取 ” 一 ", 但 乘 
子 是 不 定 的 。 在 这 种 情况 下 ,我 们 可 以 取 N; 一 7, 即 黔 过 第 + 步 。 
这 是 允许 的 ， 因 为 4,- 的 前 > 列 已 经 是 三 角 型 。 与 不 稳定 的 过 
程 一 样 ， 这 种 情况 仅仅 在 4。 的 前 * 列 线性 相关 时 才 会 发 生 ， 这 
种 稳定 的 消去 过 程 通常 称 为 带 交换 的 或 是 让 元 素 Gaus 消去 法 ， 
注意 它 在 任何 情况 下 都 不 会 发 生 中 断 , 技 照 我 们 给 出 的 约定 , 它 是 
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唯一 的 ， 如 果 方程 组 不 相 容 ,在 回 代 时 将 显示 出 来 。 


交换 的 重要 性 


22. 如 果 我 们 从 实际 执行 交换 来 考 虞 ,那么 修正 的 过 程 的 叙述 
就 比较 简单 ,过 程 中 间 的 矩阵 是 《15.6) 所 示 的 形式 , 最 后 的 矩阵 
4。-+ 真正 是 上 三 角 型 ， 在 某 些 计算 机 上 , 保持 方程 的 原来 位 置 和 
对 主 元 的 位 置 作 一 个 记录 可 能 更 方便 。 对 于 =” 一 5 的 情况 ， 最 后 
的 矩阵 形 如 : 


000XX 
0 X X X X 

xxx x xj (22.1) 
00xxx 

0000 Xx 


这 里 主 元 素 依 次 在 第 3, 第 2, 第 4, 第 1 和 第 5 行 。 最 终 的 和 矩 阵 作 
行 置换 后 是 三 角 型 ， 
如 果 我 们 实行 行 交换 ,那么 我 们 得 到 
A — Bat Noela ep NlaaN ,Ti Aor — bo). 
(22.2) 
现在 我 们 证 明 选 主 元 有 效 地 确定 4 的 一 个 行 置换 ,使 得 Gauss 消 
去 法 进行 时 不 用 选 主 元 素 ,并 且 所 用 的 乘 子 的 模 不 大 于 1， 
为 了 避免 含糊 不 清 并 且 使 得 证 明 简化 ， 我 们 用 4 一 4 的 情况 
来 作 说 明 。 从 (22.2) 得 到 
而 一 NslssrNal yr Ni Ao 
= NTs Na Tarlsar) Tyr NA Ta ls Ty ) Tn Aos 
(22.3) 
因为 括号 内 的 乘积 是 单位 矩阵 ， 重 新 组 合 这 些 因子 ,我 们 得 到 
A = NsNals a ) {33d NTT) (addi Ao) 
一 NN,N, A. (22.4) 
其 中 由 第 1 章 $41(iv), 可 知 吕 和 若是 从 N; 和 NN, 推导 出 来 的 。 
它们 的 差别 仅仅 是 对 角 线 下 面 的 元 素 作 了 置换 ,而 各 是 由 4 作 
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了 行 置换 得 来 的 。 现 在 假定 我 们 必须 对 矛 执行 Gauss 消去 法 , 且 
不 选 主 元 素 。 我 们 会 得 到 

At = NENYNFA,, (22.5) 
其 中 售 是 上 三 角 型 ，N3，N9，N# 是 一 般 的 初等 矩阵 。 方程 
{22.4) 和 (22.5) 给 出 名 的 两 个 三 角形 矩阵 分 解 (有 单位 下 三 角形 
册子 ), 因 此 它们 是 恒 等 的 。 这 意味 着 N 一 N#, NN, 一 N?,N, 一 
和。 因此 ,各 的 不 选 主 元 案 的 Gauss 法 导出 的 乘 子 的 模 不 大 于 
1, 


数值 例子 


23. 在 表 1 中 我 们 列 出 用 四 位 十 进位 的 定点 运算 及 带 交换 的 
Gauss 消去 法 解 一 个 由 阶 方程 组 的 过 程 ， 如 果 用 铅笔 和 纸 来 计算 
执行 交换 是 不 方便 的 ， 因 为 要 按 正确 的 次 序 重新 写 方程 。 我们 改 
用 方程 下 划一 直线 来 标明 主 元 素 所 在 的 方程 ， 我 们 在 简化 的 方程 
组 中 都 包括 了 用 作 主 元 行 的 方程 ， 因 此 简化 后 的 方程 组 与 原 方程 
组 等 价 。 解 计算 到 小 数 点 后 一 位 ,因此 最 大 的 分 量 有 四 位 数字 , 换 
名 话说 ,我 们 已 产生 一 个 4 位 块 浮 点 的 解 。 

我 们 立刻 可 以 看 由 ， 解 的 最 大 分 量 不 见得 有 多 于 2 位 正确 的 
有 效 位 ,因为 它 是 用 一 0.0052 除 0.5453 得 到 的 。 现 在 在 除数 中 仅 
仅 册 现 一 次 舍 人 误差 ,这 表明 即使 没有 任何 爹 人 误差 的 “累加 ”, 我 
们 估计 在 计算 的 * 中 也 会 有 百 分 之 一 的 误差 。 一 般 来 说 ,在 任 
何 主 元 案 上 损失 多 位 有 效 位 时 ， 我 们 预料 解 的 某 些 分 量 至 少 也 损 
失 多 位 有 效 位 。 

在 表 1 中 我 们 给 出 简化 过 程 的 每 一 阶段 产生 的 合 人 误差 这 
些 误差 的 重要 性 在 $24, $25 讨论 。 我 们 也 给 出 了 置换 后 的 和 
A, 这 给 出 了 真正 的 三 角形 矩 降 , 同 时 也 给 出 了 作 滞 样 的 置换 之 后 
的 准确 的 乘积 N(L4:i)。 若 在 三 角形 因子 化 中 用 准确 的 计算 , 它 
应 该 等 于 (hoi 如 )， 但 行 的 次 序 应 是 4,2,3,1， 注 意 NG4si5) 确 
实 十 分 靠近 它 , 最 大 的 偏差 是 0.00006248 出 现在 元 素 (1,47 中 。 

最 后 , 我 们 给 出 对 计算 的 x 的 4ox 的 准确 值 和 定义 为 上 一 下 


= 21Se 


00TTS9ZY "Oi ZSLES699°0 SSL98[yO ZaEOEZI90 PELTATEL"O 
S8991E18°0 ! SI6EZIIS*0 LEEBSTIEO $26PEIV 0 EEOELZEL'O 
OSL9991Z 0! 0588TT88-0 OSLILSTh'O OSL9SL18°0 055ZE82 0 
000059T5 "01 DOOOETIL"O 000059z8"0 O000S9TZ"0 00008598"0， 


[0 


ESbs*0 1z500°0— ‘0000°T cist*0— ft0g4o 8L97°0 
B88E°0 :9ItZ"0— 1768°0— D000°t ZH2EO I998°0 
068020 一 1980 99t00 +OrL'O 0000'T OS6t°0 
STS"0 1EzI 0 59z8"0 5917"0 898 "0 0000 
《 鳃 吕 鸭 噩 )C49 区 》 a 
S0010*0 i 9050 690 Sos°0 gril0 sza"0 S91z°0 5598-0 
L1800°0 1 F0018°0 929 S882°0 [glyz*0— tz6s°0— 0000:0 0000:0 
E0420°0 | 2Z968T"0 1°69 0650°0— 1 98Zy"0 9910°0 $012*0 0000"0 
96780°0 tEZhp "0 6°8 5895"0 176000~— 000070 0000"0 0000"0 
《外 唤 于》 4 《的 同 束 ) zz 上 轴 莫 上 = 
0 1 0 0 0 o S918°0 1 grt4"0 9z8"0 .S912°0 £598°0 
0 0 0 0 0 8805"0 1 9TyE0 二 126870 一 “0000*0 0000°0 
0 H 0 0 0 0 0650"0 一 }98zp"0 9910°0 。 yQH 0 00000 
D092°0 00ze%0 strino0~ 0 0 yxX95 【550T"0 Yetl*0 0000%0 0000°0 (segp°0~— 
ysr0 ar0T 一 
0 0 0 0 0 5g9[5-0 1 ESzTCD S980 5917G gc98°0 
08sy 0 一 Be 0 一 8z810 一 so1T0 0 Z9LE°0 Yr980°0— L986°0~ E057°0 0000.0 《zyz6"0 
0 0 0 o 0 0650"0 一 98Cys0 9910°0 50T4 0 0000°0 
LT5 0 一 zs8p°0— 20Lt"0— zESz 0 a QeEEG 1 980 eel0 ftss°0 0000°0 《59870 
Gao seo 9 
0 0 0 0 0 0090 2 S9700 99070559870 
5908 0 467Z0 一 S910°0 SE61°0— 80820 Z8180 (916°0 9ZTE 0 gElbO 1z5C0 (19ra°0 
05z5 0 一 O511°0— DSLI*O 952E -0 一 058Z“ £915°D IZ1sg0 xzSZk0O 9189 E82y0 《056y"0 
DegT*0 909y "0 一 O29E°0 OFZ°O— yfLt°0 Ese8°0 19599"0 LEIb"D EzI9°0 zl8z"0 C8L9¢°0 
了? 和 的 x 四 
ofss0L Bi 9 一 2 
T 半 


#216. 


一 4ox 的 向量 +。 这 个 向 量 称 为 关于 x 的 剩余 向 重 ， 基 分 便 称 为 

剩余 ， 我 们 已 列 出 它 的 极 大 剩余 是 0.03296， 这 是 意外 地 小 的 。 因 
为 我 们 估计 仅仅 在 x 就 会 有 数量 级 为 1 的 误差 , 这 一 误差 可 能 造 
成 数量 级 为 1 的 剩余 误差 .后 面 我 们 将 会 看 到 ,用 Gauss 消去 法 
和 向 后 加 代 计 算 的 解 总 有 这 样 的 误差 , 它 以 剩余 的 方式 表示 时 , 剩 
余 比 解 的 误差 小 ,并 且 可 能 使 我 们 产生 误解 。 事实 上 , x 的 分 量 的 
误差 计 到 小 数 点 后 一 位 是 一 0.1, 一 1.0, 一 0.9,1.4. 


Gauss 消去 法 的 误差 分 析 


24. 带 有 交换 的 Gauss 消去 法 中 的 步 马 ,除了 我 们 必须 在 简化 
的 矩阵 中 确定 零 元 位 置 之 外 ， 已 被 第 三 章 $48 的 一 般 性 分 析 概 括 
了 . 可 是 ,这 是 我 们 给 的 第 一 个 详细 分 析 , 又 因为 它 在 形式 上 最 简 
单 ， 我 们 打算 给 出 相当 详尽 的 叙述 使 得 读者 能 完全 理解 其 基本 特 

首先 ,我 们 给 出 一 个 一 般 竹 的 分 析 , 它 对 定点 或 浮 点 计算 都 适 
用 我 们 假定 原 短 阵 已 经 作 了 $22 叙述 的 置换 ， 因 此 不 需要 再 进 
行 交换 . 我 们 的 分 析 中 涉及 计算 的 和 和 计算 的 4 的 元 素 , 因 此 从 


“名 在 家 们 计 究 过 次 产生 的 作 阵 的 (i, 站 元. 

(CD 着 了 > ia 则 这 元 素 在 第 1,2，…,i 一 ! 步 部 被 修改 ; 然 
后 它 变 为 主 行 的 一 个 元 素 ,以 后 不 理发 生变 化 .我 们 可 以 写 
三 哪 一 mn 名 十 e， 


= DD 
二 一 nt 


(24.1) 


a a ga + ey, 
其 中 sp 是 以 计算 的 中 -nk 和 岗 -” 计算 a 欣 时 产生 的 误 
差 。 通 党 我 们 仅仅 确定 sy 的 异 , 它 依 吉 于 合用 的 运算 类 型 
(ii) 如果; > j, 那么 这 个 元 素 在 第 1, 2,…,i 一 1 步 都 被 修 
改 .最 后 ,在 第 ; 步 化 为 零 ;在 这 同时 , 它 被 用 来 计算 my。 各 个 方 
程 与 (24.1) 相 同 ,只 是 最 后 一 个 方程 是 
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of 基 一 my- 十 s 人 >。 (24.2} 
我 们 进一步 有 
ni a fa ? + En, (24.3) 
把 最 后 一 个 方程 表示 为 (24.1) 同 样 的 形成 , 它 变 为 
0 ?~ nia? + ep (ep eas (244) 
注意 ， 在 这 个 方程 左边 的 零 对 应 于 第 7 步 简化 之 启 在 位 置 (i, 力 
中 播 人 的 零 . (24.1) 的 各 方程 相 加 消去 两 边 相同 的 项 并 且 重 新 安 
排 ,对 7 实 i 我 们 有 
nng + nea; FF a + a 
a 十 8 办 十 8 凡 十 -十 gf 了; (24.5) 
而 对 于 i > ji， 如果 我 们 包括 方程 24.4), 则 有 
ma 人 十 #0 于 十 "十 2a? a 从 十 8 委 十 e 委 十 … 十 办. 
(24.6) 


类 似 地 ,对 于 右 端 项 ,我 们 有 
b= BD — nb D+ et (Kl ,i 1), (24.7) 
这 给 出 
LN 十 二 
(24.8) 
方程 (24.5), (24.6) 和 (24.8) 表明 
N(Asibns) = (Ao Tt Fib + k), 
其 中 
后 二 于 二 二? 守门， 
入 三 寺 十 十 Ef > 站， (24.9) 
右 一 6 由 十 十 sD 
换 名 话说， 计算 的 矩阵 N 和 4。-: 就 是 由 (4 十 F) 的 准确 的 分 解 
得 到 的 矩阵 。 这 个 结果 是 准确 的 ,没有 第 二 阶 量 的 扩大 或 忽 路 .这 
是 和 第 三 章 的 分 析 一 致 的 ， 负 是 现在 我 们 是 在 较 好 的 情况 下 得 到 
爹 人 误差 的 上 界 . 
从 这 些 结果 我 们 得 到 两 个 主要 结论 ， 
I. 4,- 的 准确 的 行列 式 ， 即 nfe 时 …a%? 是 (4 十 F) 的 


2lBe 


准确 的 行列 式 . 
了 4e-z 一 2-: 的 准确 解 是 〈4 十 F)x 一 如 十 的 准确 
解 . 


用 定点 运算 的 摄 动 矩阵 的 上 界 


25. 我 们 假定 原 方程 组 是 规范 化 、 平 衡 的 , 至少 是 近似 地 规范 
化 的 平衡 ,并 且 已 经 进行 了 交换 ， 我 们 进一步 假设 (现在 完全 没有 
保证 ), 所 有 的 < 你 和 4 妈 的 模 不 大 于 I。 一般 s 则 是 以 计算 的 
值 党 5 nn 和 咽 " 计算 a 匈 时 产生 的 误差 。 在 这 过 程 中 仅 
仅 是 在 24 位 的 乘积 mte 若 -会 人 为 上 位 时 产生 一 次 侈 人 误差 . 因 
此 ， 


js 多 | < 二 2 (25.1) 
除了 在 计算 mi 时 在 除法 中 产生 的 误差 8 煞 之 外 , 这 估计 对 于 所 
有 的 s 史 成立 。 由 (24.3)，E 满足 

isl < 到 2 (25.2) 
因为 它 是 单个 除法 的 误差 。 因 为 |e 后 ?| 之 14 折 ?1 现在 我 们 确 


实 得 到 msl 亏 1， 所 以 ,会 人 误差 不 可 能 导出 模 大 于 1 的 值 。 从 
(24.4) 和 我 们 关于 简化 后 矩阵 的 元 素 的 假定 ,我 们 得 到 


ls logsl < 二 2 (25.3) 
类 似 地 ,在 我 们 对 元 素 5 所 作 的 假定 下 ,有 
1s 史 | 和 于 2 (25.4) 


对 所 有 有 关 的 ,联合 关系 式 (25.1),(25.3) 和 (25.4), 我 们 得 到 
10— D2 (<)), 
Wil < 到 各 一 D2 fol < 
三 12 > 


(25.5) 
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这 些 结果 是 极端 的 上 界 。 

在 表 1 中 我 们 展示 了 前 面 的 例子 在 消去 过 程 中 的 每 一 步 的 误 
差 ， 在 表 的 最 后 显示 了 N(4si%) 的 准确 的 值 。 它 应 与 作 适当 的 
行 阐 换 后 的 〈4oip) 作 比 较 。 作 置换 后 , 差 N(43i5,) 一 (4oit) 
是 每 一 阶段 误差 矩阵 的 准确 的 和 。 


约 化 后 的 矩阵 元 素 的 上 界 


26. 到 目前 为 止 ;对 于 所 有 i,i, 假定 1a 兴 | 扎 1， 即 使 选用 
主 元 素 也 仅仅 能 保证 | 多 | < 2*, 这 一 点 从 下 述 不 等 式 得 到 ; 
1 入 | 一 La 一 nel a 十 1 C261) 
可 惜 ,我 们 能 构造 一 些 矩阵 (完全 是 人 为 的 ) 达到 这 个 界 。 如 下 形 
式 的 矩阵 便 是 例子 : 


1 0 0 人 0 工 
一 1 1 0 ol 
一 1 一 1 1 0 1 (26.2) 
一 1 一 1 一 ! 1 工 
一 1 一 1 一 1 一 1 1 


全 主 元 素 

27. 我 们 的 分 析 已 经 表明 ， 防 止 ep 元 素 迅 速 增长 是 极其 重 
要 的 ， 现 在 我 们 考虑 另 一 种 主 元 素 的 方法 ， 它 能 明显 地 给 出 较 小 
的 |e 了 P| 的 界 . 

在 $21 讨 论 的 算法 中 ,变量 是 按照 自然 的 顺序 消去 的 ,在 第 + 
步 主 元 素 是 从 4.-, 的 右 下 角 的 (2 一 + 十 1) 阶 方 阵 的 第 1 列 中 
选取 . 

现在 。 假 定 我 们 选择 的 第 "个 主 元 素 是 这 整个 方 阵 中 模 最 大 
的 元 素 。 如 果 这 个 元 素 是 在 (r',r") 位 置 (”:”” 之 +)， 那 么 , 利 
用 交换 ,我 们 可 以 写 

A = Nel A 《27.1) 

一 般 而 言 , 行 和 列 都 变 交 换 , 变 量 就 不 再 按 自 然 的 贤 序 消去 了 。 可 
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是 ,最 后 的 矩阵 4*-， 依然 是 土 三角 型 。 当 ”一 4 时 ,我 们 有 
Nlsa Na NAol aed ly, sala Taex) 
一 NsoNahyr Nl bs 《27.2) 
因为 插入 和 * 之 间 的 因子 的 乘积 是 7。 因 此 4,y 一 6, 的 解 是 
了 ezo7iavz. 现 在 我 们 使 用 4 的 双边 等 价 变换 ， 右 边 怀 的 是 
简单 的 置换 矩 阵 。 这 种 改进 的 方法 称 为 全 主 元 素 方 法， 以 前 的 方 
法 称 为 部 分 主 元 素 方 法 。 关于 全 主 元 素 方法 Wilkinson (1961b) 
已 经 证 明 
{oo| & rHL2304 a fr)a, (27.3) 
其 中 一 maxia 铭 |。 在 表 2 中 我 们 对 有 代表 性 的 值 给 出 对 应 
的 f(r) 值 . 
守 2 

r 10 20 50 100 

Kr) 19 | 67 530 | 3300 
对 于 大 的 ,函数 万) 比 2 小 得 多 ,(27.3) 的 证 明 方法 表明 ,真正 
的 上 界 仍 然 十 十 分 小 的 。 事实 上 ， 还 未 发 现 一 个 矩阵 使 得 fr) 
之 +， 对 于 (26.2) 的 形式 的 任何 阶 矩 阵 , 用 全 主 元 素 方法 , 极 大 元 
素 是 2， 有 人 可 能 试图 导出 这 样 的 结论 ， 建 议 在 任何 情况 都 用 全 
主 元 素 方法 ， 但 是 部 分 主 元 素 方 法 有 很 多 优点 ， 最 重要 的 有 下 述 
两 点 。 

{DD 在 有 辅助 存 贮 设备 的 计算 机 上 ， 它 比 全 主 元 素 方法 容易 
组 织 。 

(了 I) 对 于 有 大 量 零 元 素 以 特殊 形式 分 布 的 矩阵 ， 部 分 主 元 素 
方法 可 以 保护 这 些 零 元 分 布 形式 ,但 是 全 主 元 素 方法 会 破坏 它 .从 
我 们 自己 应 用 的 观点 来 看 ,这 是 一 个 特别 令 人 信服 的 论证 ， 

尽管 存在 (26.2) 形式 的 矩阵 , 但 我 们 的 经 验 是 ， 即 使 采用 部 
分 主 元 索 方法 ,各 个 4, 的 元 素 明 显 增 大 的 情况 是 很 少见 的 ， 如 果 
挎 阵 4 完全 是 病态 的 ， 各 个 4 的 共同 点 是 它 的 元 素 显 示 出 一 个 
稳定 的 向 下 的 趋势 。 特 别 地 ， 如 果 (i, 六 元 素 是 i,i 的 光滑 函数 ， 
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这 时 消去 法 给 出 的 结果 十 分 类 似 于 差分 。 在 我 们 的 经 验 中 还 没有 
一 个 自然 地 产生 的 例 于 给 出 像 16 这 样 大 的 增长 因子 。 
部 分 主 元 奈 方 法 的 实际 过 程 

28. 被 推荐 在 定点 计算 机 上 使 用 的 部 分 主 元 素 方法 是 这 样 选 
行 的 ， 我 们 着 先 给 矩阵 引信 比例 因子 ,使得 所 有 元 素 在 一 十 到 十 
的 范围 之 内 .因此 ,我 们 执行 一 步 ,元 案 没有 超过 1 的 危险 。 在 执 
行 这 一 步 中 ,我 们 检查 每 一 个 计算 后 的 元 素 ,看 它 是 否 横 大 于 二 
如 果 有 革 个 元 素 起 过 二 ,那么 计算 完 这 一 行 之 后 ,全 都 除 以 2, 所 
以 ,在 进行 下 一 步 之 前 类 阵 的 元 过 都 在 一 二 到 二 攀 围 之 内 . 


根 应 的 误差 分 析 仅仅 需要 作 简 单 的 修改 。 在 我 们 用 2 除 某 一 
行 这 个 阶 中 ,每 一 个 元 素 上 产生 以 2 为 界 的 额外 的 舍 人 误差 . 以 


后 在 这 一 行 产 生 的 舍 人 误差 等 价 于 原 抵 阵 的 以 2 而 不 是 二 2 


为 界 的 摄 动 ,这 个 影响 到 了 原 矩 阵 的 伟人 误差 仍然 是 严格 地 相 加 的 。 
如 果 一 行 发 生 了 多 次 被 除 ,我 们 同样 地 应 用 上 述 分 析 . 


浮 点 误差 分 析 


29. 在 $28 中 描述 的 定点 方法 ,虽然 我 们 已 指出 它 在 基 些 方面 
十 分 类 似 于 浮 点 的 ， 但 是 在 实际 上 行 的 除法 并 不 经 常 发 生 。 真 正 
的 浮 点 计算 的 误差 分 析 遵循 着 几乎 相同 的 方法 ,现在 我 们 有 
op = Alla? — nae?) 
= [oY — 0 + eI + 8) (sl 和 29， 
(29.1) 


ni = fia da) = of ?fa + bi 


( Isl < 二 2 ). (29.2) 


这 里 我 们 能 用 5 的 一 个 绝对 的 界 , 久 为 主 元 素 保 证 了 |zz| < 1, 
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如 果 我 们 假定 


la < a, (29.3) 
那么 使 用 定点 分 析 一 样 的 记号 ,我 们 有 
lspi = {fs| < 2 (i > DN). (29.4) 


然而 对 于 所 有 其 他 有 关 的 ?和 ,一 个 简单 的 演算 表明 必然 有 
lp1 = | 
工 十 8 
2 al 2) + a S201)a 十 ou- 
(29.5) 


一 ns 入 D8, 


这 些 界 证 明了 计算 的 NN 和 4,-; 满足 

N4。 = do t+ Fs (29.6) 
其 中 

AE 
{te + {206+ :7+ + (2.01)a; + (1.01)a7] (i 2 7), 
27[a0 十 《2.01)e 十 … + (2.01)aia + (1.51)a;L (i > 7). 
(29.7) 

界 (29.7) 还 能 稍 作 改进 , 但 对 我 们 的 目的 没有 多 少 收益 ， 这 些 事 
实证 明了 如 果 1a 多 | 所 a 对 所 有 有 关 i,i 的 成 立 , 那 么 必定 有 


(2.01)27aGi — 1) 
Hl <| (29.8) 
{2.01)2™ai. 


式 (29.7) 说 明 , 当 sj 随 着 太 的 山 加 而 逐步 下 降 时 , R 的 浮 点 的 
界 比 定点 界 好 得 多 。 如果 
a < 2 {29.9) 
六 而 每 一 阶段 大 概 损失 一 位 二 进位 ,那么 
| 六 | 2 十 《2.01D(2 一 十 2 十 < (3.01)27. 
(29.10) 
对 某 些 类 型 的 病态 方程 组 ,其 有 效 位 的 逐渐 损失 是 十 分 平常 的 .我 
们 的 结果 证 明了 浮 点 计算 应 该 是 比较 优越 的 ， 并 且 在 实践 中 已 经 
组 到 证 明 . 《在 定点 计算 中 ,如 果 在 每 一 步 简化 之 后 ， 用 使 得 元 素 
保持 在 土 1 范围 之 内 的 2 的 最 大 寡 乘 每 一 行 ， 我 们 能 得 到 类 似 的 
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结果 .) 
对 于 在 右 端 产生 的 伟人 误差 ,我 们 可 以 得 到 类 似 鬼 结果 . 


不 选 主 元 素 的 浮 点 分 解 
30， 在 表 3 中 我 们 给 出 一 个 简单 的 例 了 来 说 明 不 按 关 小 选 主 
元 素 可 能 产生 极 大 的 精度 损失 .给 出 的 甜 隆 是 良 态 的 ， 供 是 不 选 
主 元 素 导 臻 精度 受到 致命 的 损失 .。 4 中 的 数 分 布 在 很 广 的 范围 
内 ,因此 使 用 了 浮 点 计算 ， 
衣 3 


和 4 加 
0.000003 9.213472 0.332447 : 0.235262 


0.127653 


71837-3》 0.215512 0.375623 0.476625 上 
57752.3)》 。 0.173237 0.663257 0.625675 { 0.285321 
4 
0.000003 0.213472 0.332147 |! 0.235262 
! 


0.000000 一 15334.9 一 23860.0| 一 16900.5 


0-803905) 0.000000 一 !2327.8 一 19181.73 —13586.6 
4 bs 


0.000003 0.213472 0.332147 } 0.235262 
1 


.000000 一 15334.9 一 23860.0 ! 一 16900.5 


0.000000 0,000000 —0.5000001 --9,280000 


x 一 的 准确 的 平 寅 的 Bx 一 
0.000003 0.213472 0,332147 1 0.235262 
0.2155119 0.3521056 0.5436831 ! 0.0863726 
0.1732569 0.6989856 0.5531881 1 0.3216026 


第 一 个 主 元 素 十 分 小 ， 致 使 rs 和 mx 都 是 10 的 数量 级 。 计 
算 的 4, 和 所 的 元 素 相应 地 都 十 分 大 。 如 果 我 们 考虑 4 捍 的 计算 ， 
我 们 有 

a — l(a — p20) = (0.476625 一 71837.3 X 0.332147) 
= 九 (0.476625 一 23860.5) 一 一 23860.0。 
最 一 me 昌 的 准确 的 值 是 
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0.476625 一 23860.5436831 一 一 23860.0670581 
而 量 sp 是 这 两 个 值 之 差 。 观察 在 计算 a 的 时 候 ，o 娘 中 几 
平 所 有 的 数位 都 被 略 去 了 ; a 各 在 0.45 至 0.549999 范围 内 取 任 
何 值 我 们 都 会 得 到 同样 的 os 的 值 。 在 表 3 中 我 们 列 出 了 所 得 
到 的 有 误差 的 方程 。 我 们 已 看 出 ， 被 摄 动 的 第 二 和 第 三 个 方程 与 
原 方程 没有 关系 .容易 验证 。 计 算 所 得 的 方程 组 的 解 是 很 不 准确 
的 。 

我 们 也 列 出 了 计算 中 的 第 二 步 。 注意 ， 在 第 一 步 中 第 三 个 方 
程 产 生 的 大 元 素 ,在 第 二 步 中 变 小 了 。 可 是 ,显然 计算 的 a 多 的 所 
有 位 几乎 都 是 错 的 ， 用 a 怨 s2a 镶 给 出 的 行列 式 的 值 也 是 很 不 准 
确 的 。 显然, 这 是 因为 “外 至 多 只 有 一 位 正确 的 有 效 数字 . 


有 效 位 的 损失 


31, 到 虽 前 为 站 ,我 们 的 注意 力 集中 在 研究 某 些 技术 的 危险 性 
上 ， 这 种 技术 引起 4 的 元 素 增长 。 在 元 素 是 逐渐 缩减 的 情况 下 ， 
精度 的 损失 更 为 严重 ， 人 们 也 许 反对 这 个 结论 。 这 种 现象 的 确 是 
存在 的 ， 但 是 这 两 种 现象 之 间 存 在 重大 的 差别 ， 当 不 选 主 元 素 或 
用 部 分 主 元 素 代替 全 主 元 素 ,因而 简化 的 矩阵 的 元 素 十 分 大 时 ,我 
们 受到 有 效 数字 的 损失 。 这 种 损失 并 非 必然 的 ， 而 是 可 以 用 好 的 
策略 来 避免 

另 一 方面 ,有效 位 的 逐步 损失 是 病态 的 后 果 , 由 此 引起 的 或 多 
或 少 的 精度 损失 是 不 可 避免 ，529 的 论证 表明 ,如 果 使 用 浮 点 , 那 
么 当 消 去 过 程 中 产生 有 效 位 损失 时 ， 原 方程 上 的 等 价 摄 动 实际 上 
小 于 不 发 生 这 种 损失 的 情况 。 


流传 的 谣 误 

32. 有 一 个 很 流行 的 看 法 认为 ,选取 大 的 主 元 在 某 些 方面 是 有 
危害 的 。 其 论点 是 :“ 主 元 素 的 乘积 等 于 4 的 行列 式 ， 它 不 依赖 
于 主 元 素 如 何 选取 。 如 果 我 们 开始 选 大 的 ， 那 么 后 面 的 主 元 素 不 
可 避免 地 是 比较 小 的 ,因此 有 较 大 的 相对 误 荆 .” 
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确实 有 一 些 和 矩阵 用 完全 主 元 素 时 最 后 一 个 主 元 素 是 小 的 ,但 
朋 部 分 主 元 素 时 它 却 不 是 小 量 ， 不 过 最 后 一 个 主 元 素 是 逆 知 阵 的 
类 个 元 素 的 倒数 ,这 与 使 用 的 策略 无 关 ， 因 此 , 它 不 可 能 小 到 比如 
说 2-* 这 样 小 , 除非 逆 抵 阵 的 范 数 至 少 达 到 2 那么 大 ， 和 如果 短 阵 
确实 有 这 么 大 的 逆 ， 那 么 相应 地 精确 度 必 定 受 到 严重 损失 ， 小 主 
元 案 的 发 生 只 不 过 是 病态 本 身 的 一 种 反映 ， 在 530 的 例子 中 我 们 
看 到 ,用 一 个 “不 必要 ”的 小 主 元 素 不 一 定 使 得 最 后 的 主 元 素 变 得 
大 一 点 。 定 只 不 过 是 导致 了 一步 产 生 一 个 十 分 大 的 在 元 素 ， 并 县 
在 再 下 一 步 转 回 “正常” 

我 们 不 声称 选取 最 大 的 元 素 作 主 元 是 最 好 的 第 略 。 并 且 这 的 
确 常常 是 很 不 正确 的 。 我 们 认为 ， 现 在 仍然 没有 提出 另 一 个 实际 
的 方法 。 有 一 种 建议 是 ， 选 的 主 元 素 应 该 是 它 的 模 最 大 近 行列 式 
的 绝对 值 的 = 次 根 。 有 三 个 理由 反对 这 一 建议 和 有 关 的 提 法 ， 

(i) 在 Gaus 消去 法 完成 之 前 ,一 般 不 知道 行列 式 的 值 . 

(i) 可 能 没有 元 素 僻 近 所 提出 的 值 ， 

(ii) 即使 GD 和 (i) 都 成 立 ,我 们 也 不 难 找 出 一 些 例子 说 明 它 
是 极 坏 的 策略 ， 另 一 方面 ， 完 全 主 元 素 方法 从 来 不 是 十 分 坏 的 。 


特殊 形式 的 矩阵 


33. 在 特征 值 问题 中 有 三 种 特殊 类 型 的 矩阵 是 极其 重要 的 ,并 
且 对 这 些 矩阵 选 主 元 素 方法 十 分 简单 。 因为 问题 十 分 简单 ， 而 且 
Wilkinson (1961b) 已 给 出 了 详尽 的 叙述 ,下 述 结果 的 证 明 仅仅 是 
概括 性 的 ， 
类 I. Hessenberg 和 托 阵 。 如 采 
ai— 0 i>i+ 2), (33.1) 
我 们 定义 4 是 上 Hessenberg 矩阵 ， 类 似 地 ,如 果 
= 0 (i+2), (33.2) 
我 们 说 4 是 下 Hessenberg 年 阵 。 所 以 ,如 果 4 是 上 Hessenberg 矩 
阵 , 那 么 47 是 下 Hessenberg 矩阵 ,如 果 我 们 对 一 个 上 Hessenberg 
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矩阵 执行 部 分 主 元 Gans 消去 法 ,对 于 ”一 6r 一 3 在 第 +* 步 
开始 时 ，4,-， 的 形状 可 以 表示 为 : 


xxxxxx 
oxxxxx 
oxxxx 

x x x xj (33.3) 
xxx 
xx 


标明 的 零 元 是 以 前 各 步 产生 的 , 矩阵 的 右 下 角 是 上 Hessenberg 矩 
阵 。 先 阵 的 第 〈r 十 1) 行 到 第 ” 行 与 4 的 相同 ， 在 这 和 矩阵 中 仅 
有 两 行 涉及 ”， 因 此 7 或 者 是 ?或 者 是 r 十 1。 我 们 可 以 按照 
一 + 十 1 或 r' 一 + 来 判断 在 第 7” 步 是 否 有 交换 ,从 此 我 们 可 以 
说 明 , 如 果 


14 罗 | 所 1, 那么 lo 名 | 私 "十 1， (33.4) 

并 且 太 (置换 后 的 N) 的 每 一 列 只 有 一 个 次 对 角 线 元 素 。 以 6 阶 
矩阵 为 例 , 如 果 在 第 一 ,三 ,四 步 进 行 了 交换 ,那么 个 的 形状 是 

1 

x1 

0 0 1 

0 0 0 。 (33.5) 

oxxx1 

000 


如 果 下 Hessenberg 甜 阵 需 要 执行 Gauss 消去 法 ， 那 么 应 该 按 次 
序 消 去 变量 zx- …，x， 使 得 最 后 的 矩阵 是 下 三 角 型 。 在 上 
ty 用 完全 主 元 素 方法 会 破坏 矩阵 的 篇 单 形式 ,又 因为 

a 多 我 们 已 经 有 很 好 的 界 , 因此 完全 主 元 素 方法 没有 特别 的 价 


入 


阵 ; 从 这 个 定义 我 们 看 出 三 对 角形 姑 阵 距 是 上 He 型 ,也 


227。 


是 下 Hessenberg 型 。 因 此 ,关于 上 Hessenberg 矩阵 ,我 们 得 到 的 
结果 对 于 三 对 角形 矩阵 也 成 立 ， 并 且 有 更 进一步 的 简化 。 牛 与 上 
面 提 到 的 形式 相同 ， 在 ”一 6,r 一 3 的 情况 下 ,如 和 4 的 形式 
是 


的 所 2 Vy WW 
Tm Wa Vi Wy 
Ys 0 及 Ws Vy Ws 
4 一 Timp | p,q 
Ys 0s fs Ys 
Tm To mm 


(33.6) 
如 果 在 第 i 步 没 有 交换 元 素 w; 是 零 。 用 简单 的 归纳 法 证 明 得 出 、 
如 果 
qo, gi, rl < 1 C= 1 ,1), (33.7) 
那么 
lp 2,19 | lel 2 1, wl 1 (33.8) 
.和 宇 对 区 入 隆 ， 对 于 这 一 站 隆 ， 不 有 条 二 元 入 
咯 ，Gauss 消去 都 是 十 分 稳定 的 。 我 们 可 以 证 朋 ， 如 果 像 $16 ~ 
样 ,我 们 写 


那么 多 ,mw-" 在 每 一 阶段 都 是 正定 对 称 的 ， 并 且 若 lo?| < 1， 
则 | 多 | 和 工 参见 Wilkinson (196lb)]. 
虽然 在 我 们 的 应 用 中 亚 定 矩阵 的 三 角 型 化 是 十 分 重要 的 ， 但 
是 我 们 不 用 Gauss 消去 法 来 实现 。 因此， 我们 略 去 有 关 的 证 明 。 
注意 ,我 们 不 要 求 N 的 所 有 元 素 都 以 1 为 界 ,并 且 这 确 有 可 能 
不 成 立 ， 我 们 用 矩阵 
[0 "006873] 
0.006873 -1.000000. 


(33.10) 
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来 说 明 〔 这 个 矩阵 m> 一 107.391)。 这 意味 着 我 们 必定 要 用 浮 点 
运算 。 但 是 一 个 大 的 蒋 子 不 会 引起 简化 后 的 矩阵 的 极 大 元 素 的 遂 
长 。 在 这 个 例 中 
a — 0.2610902. 
我 们 的 误差 分 析 已 经 证 明 ， 在 每 一 阶段 误差 反映 到 原 矩 阵 是 
不 放大 的 ， 因 为 所 有 简化 后 的 矩阵 的 全 部 元 素 都 以 1 为 界 ， 售 人 
误差 不 能 是 大 的 。 


在 高 速 计算 机 上 的 Gauss 消去 法 


34. 现在 我 们 叙述 一 个 在 计算 机 上 执行 部 分 主 元 素 Gauss 消 
去 法 的 方法 。 用 = 一 5,r 一 3 的 情况 来 说 明 。 第 + 步 开 始 时 , 存 
储 的 形式 是 

Qn a A Hm 05 本 

Hn qn An dm aas ba 

ns tr a al as Ds | (34.1) 

My a qn as Bs 

ns Hsy lss G54 455 Ds 

2 3 
最 后 一 行 的 元 素 1 ,2',… 是 描述 主 行 位 置 , ”已 在 第 (r 一 1) 步 确 
定 。 这 个 描述 方法 与 许多 自动 的 程序 设计 语言 中 用 的 很 接近 ， 例 
如 ，oi 表示 某 个 时 刻 应 作 的 爹 部 操作 已 执行 之 后 (i, 让 位 置 上 的 
元 素 。 我 们 略 去 在 数学 研究 中 使 用 的 上 标 , 第 * 步 可 叙述 如 下 : 

0) 交换 exif 一 "525 和 avi(i 一 了 2)52 注意 ， 
如 果 ” 一 ”, 不 执行 交换 。 对 于 了 从 (r 十 1) 到 = 逐次 执行 (ii)， 
《过 ) ,Kiv)。 

(i) 计算 mr 一 erf or 覆盖 在 oa 上。 

(证 ) 对 于 :从 (r 十 D) 到 = 计算 an 一 rwver 覆盖 在 sr 上 

(iv) 计算 饭 一 ro 和 覆盖 在 上。 

在 第 步 执行 过 程 中 ， 我 们 保持 asrnal 的 最 大 人 的 记录 。 如 果 
在 计算 完成 时 ,这 是 aeruvt。 那么, 我们 把 (> + 1》 记 在 最 后 一 
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行 的 第 (> 十 1) 位 置 上 , 
显然 ,我 们 要 预先 确定 4 的 第 一 列 的 模 最 大 的 元 素 的 位 置 。 


对 应 不 同 的 右 端的 解 


35. 我 们 常常 有 兴 吉 解 一 些 方程 组 4x 一 5, 它们 的 矩阵 4 相 
同 ， 但 是 有 许多 个 不 启 的 右 端 。 如 果 一 开始 我 们 就 知道 所 有 的 右 
端 ,那么 显然 我 们 可 以 按照 消去 法 来 处 理 . 如 果 我 们 取 = 个 右 端 为 
2 ea， 那么 解 就 是 4 的 逆 矩阵 的 各 列 ， 

可 是 ， 我 们 常常 使 用 的 技术 是 每 一 个 右 端 是 决定 于 上 一 个 右 
端 对 应 的 解 。 一 个 右 端 单独 处 理 有 (n 一 1) 步 ,其 第 + 步 为 

人 交换 b 和 帮 ,， 

(8) 对 于 “从 (r + 1) 到 = 计算 己 一 sra 并 覆盖 在 &b 上 


直接 的 三 角形 分 解 


36. 现在 我 们 转 男 到 不 交换 的 消去 过 程 . 显然 ， 中 间 的 约 化 
和 托 阵 4, 本 身 没有 什么 意义 ， 这 过 程 的 主要 目的 是 产生 和 丈 阵 六 和 
A 使 得 


N4。 一 如. (36.1) 
如 果 我 们 给 定 入 和 “4;-,， 对 于 任何 右 端 58, 求解 4x 一 可 以 归 
结 为 求解 下 述 两 个 三 角形 方程 组 
Ny = 6, Asx — 9, (36.2) 
这 使 我 们 想到 不 经 过 中 间 阶 段 直接 从 4 产生 矩阵 六 和 4,-, 的 可 
能 性 。 
因为 4, 要 被 去 掉 , 使 用 我 们 的 老 记号 没有 必要 了 . 因此 ， 我 
们 考虑 决定 一 个 单位 下 三 角形 矩阵 工 , 上 三 角形 矩阵 乙 和 向 量 <， 
使 得 
L(VUic) = (4i6). (36.3) 
我 们 假定 L,V 的 前 (> 一 1) 行 和 «能 利用 方程 (36.3) 商 边 的 前 
(+ 一 1) 行 的 元 素 相 等 来 决定 。 然 后 , 在 第 * 行 中 的 元 素 根 等 ,我 
们 得 到 
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Dun 一 an， 


dn 十 latn = an ， (36.4) 


avy 十 atty TF ot ht 一 gry 


ntti 十 aett + oo 十 Errtl = Annis 


nts 十 jatpze t+ oo 十 rds = den, 
ct 1ac 士 十 和 re 一 有 


由 (36.4) 式 的 第 1 个 到 第 (r 十 1) 个 方程 ,必然 可 以 而 且 唯 一 决 
定 ja， 7p，…，jvw-:。 如 果 任意 选 定 1,,, 第 + 个 方程 就 可 决定 wo。 
其 余 的 方程 唯一 决定 un, 到 ww。 和 cr 因为 对 于 第 一 行 的 元 
素 这 个 结果 显然 是 真 的 ,所 以 对 一 般 情况 也 是 对 的 . 

我 们 看 出 ,乘积 js 是 唯一 地 决定 的 , 但 1, 或 者 uw 可 以 
任意 选取 。 如 果 我 们 要 求 忆 是 单位 下 三 角形 , 那么 1, 一 1 在 这 
种 情况 下 ,仅仅 在 决定 iarG 一 1 一 1 时 有 除法 , 并 且 除 
数 是 wz。 如 果 wz 去 0 分 解 不 会 失败 ， 并 且 分 解 确实 是 唯一 的 。 


(36.5) 


在 上 述 方法 中 元 素 被 决定 的 次 序 是 : 

如 的 第 一 行 , <; 工 的 第 二 行 ; 口 的 第 二 行 , c; 等 等 。 (36.6) 
容易 验证 ,他 们 也 可 以 按 下 述 次 序 决定 ; 

如 的 第 一 行 , c; 工 的 第 一 列 ;局 的 第 二 行 , c; 工 的 第 二 列 ; 等 
等 。 (36.7) 


Gauss 消去 法 和 直接 的 三 角形 分 解 的 关系 


37. 我 们 已 经 征明, 如 果 4 是非 奇 异 的 ， 那 么 若 有 单位 下 三 角 
形 因子 的 三 角形 分 解 存 在 , 它 就 是 唯一 的 . 因此 , 工 积 吕 与 Gauss 
消去 的 六 和 4。-: 必定 恒 等 。 因此， 分 解 的 失败 和 不 唯一 性 与 不 
用 主 元 素 的 Gauss 消去 法 的 情况 一 样 、 
作为 例子 ,现在 我 们 考虑 从 下 述 关 系 决定 jms 
ln = (qm 一 at 一 1ata — Lttys) fume (37.1) 


与 Gauss 消去 法 比较 表明 
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人 a aan, (ii of an — lau, 
{Hi) a = ar 一 nt 一 Unums (37.2) 


(1) 全 一 an 一 Date — Lon 一 fat 


因此 ,在 决定 (37.1) 的 分 子 时 ,我 们 依次 得 到 41, Ad。 4 的 (+, 4) 
的 每 个 元 素 。 类 似 的 评述 可 应 用 于 计算 上 的 元 素 ， 

可 是 ， 如 果 我 们 想 利用 三 角形 分 解 。 我 们 不 写 下 这 些 中 间 结 
果 ， 更 为 重要 的 是 ,如 果 我 们 及,( ) 或 刀 ( ) 的 计算 设备 ,我 
们 不 必 每 一 次 加 法 之 后 都 伟人 为 单 精度 分子 可 以 累加 。 并 且 用 
ww 除 累加 的 值 。 可 是 ,如 果 我 们 用 没有 累加 的 标准 的 浮 点 运算 或 
定点 和 运算。 在 这 两 个 过 程 中 连 含 人 误差 者 是 一 样 的 


分 解 不 唯一 和 失败 的 例子 
38. 一 个 不 可 能 三 角形 分 解 的 矩阵 例子 是 


1 2 3 
一 12 4 11, {38.1) 
465657 


直到 出 现 中 断 前 工 和 器 的 元 素 给 定 为 
100 12 3 
工 一 |2 1 0 0 0 一 5|. (38.2) 
4 9 ， 。 、 


我 们 看 出 ，xz 一 0， 并 且 确 定 js 的 方程 是 

4x2 二 ixX0 一 6. 

注意 , 4 不 是 奇异 的 。 事 实 上 , 它 是 良 术 的 ， 
另 一 方面 ,存在 有 无 穷 多 个 分 解 的 矩阵 。 例 如 


A= (38.3) 


1 1 1 
2 2 1|. 
3 3 1 


例如 ,我 们 有 
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1 0 0 1 1 1 
工 一 |2 1 0l,v=l0o oo 一 上 |. {38.4) 
3 .31 0 0 1 


这 里 又 出 现 wa 一 0, 但 是 我 们 决定 1s 时 有 
3x1tinX0=3, 


因此 加 可 以 是 任意 的 数 。 当 我 们 选 定 14, wa 就 被 唯一 决定 ,对 
应 于 任何 右 端 的 等 价 的 三 角形 方程 组 是 


十 二 十 一 
—# = 6 (38.5) 


x3 = Cs, 


因此 ,除非 ea 一 一 <;, 否 则 没有 解 存 在 。 注 意 ,如 果 工 是 单位 三 角 

形 和 矩阵 、 多 重 性 的 必要 条 件 是 至 少 有 一 个 we 应 该 是 零 . 尽管 如 

此 ,如 果 三 角 型 分 解 存在 , 那么 4 必定 是 奇异 的 ， 因 为 4 一 LU， 

而 dtt(U) 是 零 . 因此 ,我 们 知道 解 存在 的 充分 必要 条 件 是 
rank( AIb) 一 rank( A). 

在 这 种 情况 下 ,如 果 零 元 仅仅 是 ws,， 那 么 中 断 或 多 重 性 都 不 会 发 

生 , 但 是 仅 当 cs 一 0 财 有 解 。 


上 有 行 交换 的 三 角形 分 解 


39. 除了 舍 人 误差 之 外 ，Gauss 消去 法 与 三 角形 分 解 得 等 。 最 
然 ， 选 主 元 素 对 于 分 解 的 数值 稳定 性 是 非常 重要 的 。 在 自动 计算 
机 上 ,执行 与 部 分 主 元 素 方法 等 价 的 办 法 十 分 方便 。 但 是 ,执行 等 
份 于 完全 主 元 索 方 法 的 办 法 是 不 实际 的 。 只 非 准备 使 用 多 达 两 倍 
的 存 贮 空间 ,或 者 是 执行 几乎 是 两 倍 的 运算 

现在 我 们 描述 定点 运算 中 与 部 分 主 元 素 方法 等 价 的 办 法 ， 它 
由 ?” 步 组 成 ， 在 第 * 步 ， 我 们 决定 工 的 第 > 列 ，(Vie) 的 第 * 行 
和 +:'。 对 于 # 一 5,+ 一 3 的 情形 ,第 7 步 开始 时 的 形状 是 
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Wy Hy Mls 5 
bn tm ta Wh Wy 3 5 
by has a ts By . (39.1) 
a aja Gu Ag br 


| 
而 ls las dg 0g By 8 


2 
第 ? 步 如 下 : 
i) 对 于 5 一 rr 十 1 
计算 ar 一 ax 一 Jt, 一 … 一 Peruw-or。 存储 双 精 度 的 结果 
5 在 第 : 行 的 末 尼 。，〔 注 意 ， 如 果 用 浮 点 累加 * 是 在 完成 时 舍 人 
的 , 它 没有 什么 损失 ,) 


(ii) 假定 lo 是 lal(r1 一 +,。，…,#) 中 极 大 的 ,那么 存储 
地 并 且 交换 第 > 行 和 第 r' 行 整 行 ,包括 1n, ow, 5, 5 新 的 4 含 
人 为 单 精度 给 出 wr, 并 且 禾 盖 在 ar 上 。 

(〈 让 ) 对 于 4 一 了 十 于 
计算 s/wum 给 出 4, 并 且 覆 盖 在 or 上 。 

Gv) 对 于 :一 ”十 于 
计算 an 一 faus 一 lat 一 … 一 六 au-iv， 在 完成 内 积累 加 之 
后 伟人 结果 给 出 ww, 并 了 履 芋 we 在 om 上 . 

《9) 计算 如 一 let 一 1a 一 … 一 lnrcrts 在 完成 内 积累 
加 之 后 合 和 结果 给 出 c,。 把 c, 覆盖 在 b. 上， 


表 4 


有 交换 的 三 角形 分 解 
原 方程 
0.7321 0.4135 0.3126 0.5163 D.8132 
0.2317 0.6123 0.4137 0.6696 0.4753 
0.4283 0.8176 0.4257 0.8312 0.2167 
0.8653 0-2165 0.8265 0.7423 5165 
r=4 
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第 一 大 步 后 的 形状 
0.8653 0.2165 0.8265 0.71 
0.2678 人 06123 66 
0.4950 0,8176 D4257 0.B312 0.2167 
B8461 |0.4135 0.3126 0,5163 .8132 | 


(9 
如 = 0.6123 ~ C0.2678)C0.2165) = 0.55432130 
#1 = 0.8176 一 《0.4950)(0.2165) = 0.71043250 
5 = 0.4135 一 《0.8461)(0,2165) = 0.23031935 
2 m3 
第 二 大 步 后 的 形状 
0.8653 0.2165 0.8265 0.7123 0.5165 
0.4950 0.7104 0.0166 0.4786 —0.0390 
0.267B 0.7803 人 06 | D173} 
0.8461 0.3242 0.5163 | 0.8132! 


《4) 03) 
#3 = 0.4137 — (0.2678)(0.8265) ~ (0.7803)(0.0166) = 0.17941032 
和 一 0.3126 — (0.8461)(0.8265) — (0.3242}(0.0166) 一 一 9.39208337 
3 一 4 
第 三 大 步 后 的 形状 

9.8653 0.2165 0.8265 0.9123 | 0.5165 

0.4950 0.7104 0.0166 -0.4786 | 一 0.0390 

0.8461 0.3242 一 0.3921 一 0.2415 | 0.3888 


0.2678 0.7803 一 0.4578 31 
(DD (DD 《和 

而 一 0.6696 一 《9.2678)(0.7123) 一 《0.7803)(0.4786) ~ (—0.4576X( —0.2415) 

一 一 0.00511592 

第 四 大 步 后 的 形状 和 以 淮 确 ? 
0.8653 0.2165 0.6265 0.7123 0.5165 9 一 0.02332 
0.4959 0.7104 0.0166 0.4786 | 一 0.0390 70.4 0.03339 
.8461 0.3242 一 0.3921 一 0.2415 | 0.3888 64.8 0.03005 
0.2678 0.7803 —0.4576 —0.0051 0.5453 一 106.9 ~0.01166 


《和 (3) (OD 《47 
工 X《Z : e) 《准确 ) 与 行 里 换 后 的 (4 ; 5) 比较 
0.86530000 0.21650000 0.82650000 0.71230000 | 0.51650000 
0.42832350 0.81756750 0.42571750 0.83118850 | 0.21666750 
0.73213033 0.41349233 0.31258337 0.51633915 | 0.81316685 
0.23172734 0.61230382 0.41371464 0.66961592 | 0.47327212 


我 们 看 出 , 工 和 了 的 元 素 是 按 (36.7) 指出 的 顺序 得 到 的 ,最 后 
的 结构 是 使 得 LU 等 于 作 了 置 痪 的 4, 并 且 我 们 已 存储 了 对 一 个 右 
端 作 单独 处 理 的 充分 的 信息 .这 个 处 理 包含 = 步 。 在 第 7 步 我 们 
交换 右 端 的 第 + 和 x*' 行 ,然后 执行 运算 〈(v)。 产 生 每 一 个 元 素 C， 
时 仅 包含 一 次 会 人 误差 . 

注意 , 对 于 右 端 的 处 理 我 们 已 经 与 Gavss 消去 法 一 样 的 方式 
来 安排 ， 我 们 已 经 涉及 到 在 8$34 的 步 (i) 中 包含 的 第 > 和 行 整 
行 的 交换 ,然后 我 们 可 用 内 积累 加 运算 执行 右 端的 单独 处 理 ， 

在 表 + 中 我 们 展示 了 一 个 矩阵 的 三 角形 分 解 ， 这 个 和 矩阵 是 表 
1 中 的 4 阶 阵 作 了 行 兽 换 。 表 中 说 明了 在 每 一 步 终 止 时 的 形状 、 
工 的 元 素 用 黑体 印刷 ,尚未 改动 的 元 素 组 成 的 矩阵 〈 不 计 交 换 ) 用 
点 线 框 着 - 


三 角形 分 解 的 误 关 分析 


40. 与 部 分 主 元 素 的 Gauss 消去 法 一 样 ， 我们 可 以 预料 上 节 
的 算法 得 到 的 极 大 的 || 显著 地 超过 极 大 的 a| 的 情形 是 很 
少 的 ,并 且 对 于 病态 矩阵 ，1wi| 通常 全 部 小 于 al。 

如 果 有 必要 的 话 ， 可 以 用 和 $28 类 似 的 方法 来 控制 元 素 的 大 
小 ， 我们 平衡 4 使 得 aii < 二。 并 且 在 黑 加 ”5 各 ww， 时 我 们 
在 每 一 个 加 法 之 后 检查 内 积 ;如 果 它 的 绝对 值 超过 二 就 用 2 除 


5 或 us 和 4, 2 的 第 * 行 或 第 行 的 全 部 元 素 . 注意 ， 当 我 们 累 
加 ;或 wx 时 一 次 以 上 的 这 种 除法 可 能 是 必要 的 ,与 Gauss 消去 
法 一 样 ,我 们 预料 这 样 的 除法 很 少 出 现 . 

不 计 会 人 误差 我 们 知道 LCUic) 等 于 作 了 行 置换 的 《432). 
为 了 简化 记号 ,我 们 用 《45) 表 示 这 个 置换 后 的 矩阵 ,我 们 现在 要 
求 L(Uic) 一 (4i2) 的 界 ,假定 没有 用 2 除 的 必要 ,我 们 有 


tl) (40.1) 


其 中 5。 称 为 计算 值 ， 因 此 
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a ty 十 tts 十 二 十 rr (40.2) 
对 计算 的 wx 和 c， 类似 地 有 


Wt an — at 一 at 一 Br 
1 
( fond < 3 27), (40.3) 
er 二 及 一 和 一 jca 一 一 和 rier 十 全 
(ls1< 支 2 人 小 (40.4) 


把 上 , U 和 < 的 各 项 集中 到 一 边 ,关系 式 (40.2),《40.3),(40.4) 表 
上 明 
LVI) = (4 + F, b+K), (40,5) 


2 (<7), 
上风 生计 和 al G> 六 Co6) 
工 2- 
1 < 
因为 我 们 候 定 了 il < 1, 我 们 看 出 所 有 的 所 满足 
1412 
tl 生 2 2 
但 是 ,如 果 某 些 | | 比 工 小 得 多 ,那么 许多 元 素 lial 也 比 
2 
小 得 多 . 
关系 式 (40.6) 证 明 , 如 果 我 们 能 作 内 积累 加 ,有 交换 的 三 角形 
分 解 是 十 分 精确 的 方法 . 当 4 的 元 素 不 能 用 :位 数 表达 时 , 初 抬 数 
撮合 人 为 。 位 造成 的 误差 通常 与 三 角形 化 的 全 部 误差 的 影响 一 样 
大 ， 注 意 ,我 们 不 得 不 说 “通常 *， 这 里 为 了 包括 那些 罕见 的 情况 ， 
即 尽管 用 了 交换 , 0 的 基 些 元 案 仍 是 明 吧 地 大 于 4 的 元 素 。 
在 表 4 的 最 后 给 出 二 和 (Uic) 的 准确 的 乘积 , 以便 与 (415) 
作 比 较 。 可 看 到 最 大 的 差 是 0.00003915， 是 在 (1.4) 元 素 上 ,这 小 
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于 一 个 含 人 误差 的 极 大 信 。， 
行列 式 计算 “ 
41. 假设 4 是 原 矩 竹 置 换 后 的 形式 ,从 关系 LU 一 4 十 我 
们 推导 出 
det(4 + F) 一 tw tan. (41.1) 
对 原来 的 次 序 我 们 必须 用 (一 1)* 来 汪 , 其 中 * 是 天 + 的 > 的 
个 数 .在 实际 上 我 们 总 是 用 浮 点 运算 计算 行列 式 。 所 以 ,计算 值 了 
给 定 为 
也 一 (1 十 IIwr (si < (nO— 1)27). (41.2) 
对 于 任何 合理 的 值 >; 因子 (1 上 + e) 对 应 一 个 很 小 的 相对 误差 , 暂 
且 不 说 这 个 D 是 (4 十 ) 的 准确 的 行列 式 . 如 果 (4 十 F) 的 特 
征 信和 是 尺 而 4 的 特征 信息 4, 我 们 有 
dat(A) 一 In D = (1 + eI. (41.3) 
这 个 结果 在 实际 的 特征 值 问题 中 是 极其 重要 的 . 


Cholesky 分 解 


42. 当 4 是 对 称 正 定 和 矩阵 时 ,适当 进取 工 的 对 角 线 元 索 可 以 使 
得 二 是 实 的 ， 并 且 UV 一 工 ， 我 们 用 归纳 法 证 明 它 . 设 4。 是 * 
险 正 定 逢 阵 , 我 们 可 以 写 


4 - [和 a ,] (42.1) 


其 中 4,-! 是 《n 一 1) 阶 前 主子 式 ， 因此, 它 也 是 正定 的 【第 一 
章 827)。 由 归纳 法 假设 ,存在 矩阵 上 ,,， 使 得 
Lolli As {42.2) 
显然 ，L。-， 是 非 奇异 的 , 因为 [da( 工 ,0 了 一 det(4,-,)。 因 此 ， 
存在 c, 使 得 
Lac = b, (42,3) 
现在 对 任何 信 * 我 们 有 
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于 是 ,如 果 我 们 定义 x 满足 关系 
erec 十 gos (42.5) 

我 们 得 到 4。 的 三 角形 分 解 。 为 了 证 明 * 是 实 的 , 取 (42.4) 两 边 
的 行列 式 ,得 出 

[det( Li) Pr 一 det( As). (42.6) 
因为 4, 是 正定 的 ， 右 边 是 正 的 ， 所 以 x 是 实 的 并 且 也 可 取 成 正 
的 。 因 为 * 一 1 时 结论 显然 是 对 的 ， 这 就 建立 了 我 们 的 结果 . 注 
意 ， 


二 a (42.7) 
因此 ,如 果 |asl < 之 1, 那么 ai < 1 并 且 从 
B+ <l, (42.8) 
进一步 证 明 对 称 分 解 可 以 用 定点 运算 实行 ， 显 然 ， 行 列 不 需要 交 
换 。 这 种 对 称 分 解 归功 于 Choleky。 


对 称 非 正定 矩阵 


43. 如 果 4 是 对 称 但 不 是 正定 的 矩阵 ,不 作 行 列 的 交换 可 能 没 
有 三 角形 分 解 存在 。 和 矩阵 

[i] 043.1) 

就 是 一 个 简单 的 例子 。 
即使 有 三 角形 分 解 存在 ， 也 不 会 有 一 个 实 的 非 奇 异 的 工 使 三 
角形 分 解 为 ZL 的 形式 ， 因 为 对 这 样 的 L，LL" 必然 是 正定 的 ， 
可 是 ,如 果 三 角形 分 解 确实 存在 ,只 要 用 复 运算 就 可 以 有 形 如 LLT 
的 分 解 。 有趣 的 是 ， 此 时 工 的 每 一 列 或 者 完全 是 实 的 或 者 完全 是 

虚 的 。 所 以 我 们 可 写 
Ls 一 MD (43.2) 
其 中 M。 是 实 矩阵 ，Dw， 是 对 角形 矩阵 ， 其 对 角 线 元 索 是 1 或 者 
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-证明 也 是 用 归纳 法 , 并且 几乎 与 $42 的 一 样 . 现在 与 (42.7) 对 
应 的 式 子 给 出 ** 的 值 仍然 是 实 的 ,但 是 可 能 是 负 的 。 
我 们 注意 到 


如 一 工 .7 — MaDeD, MY, (43.3) 


因此 可 以 避免 使 用 虚 量 。 现 在 ，Ds 是 对 角 和 矩阵 ,其 元 素 痢 是 土 1， 
如 果 我 们 写 


4 一 (MaDoD DMI NM (43.4) 


这 给 出 4。 的 一 个 三 角形 分 解 。 其 中 N。 的 每 一 列 或 者 与 ME 对 
应 的 行 相等 ,或 者 与 对 应 行 符号 相反 。 另 一 个 办 法 是 ,我 们 可 以 把 
D。 中 的 符号 与 N, 和 M。 结合 起 来 ,使 得 M。 的 对 角 线 元 素 全 为 
正 。 王 是 两 个 矩阵 都 由 N。 来 表示 ,例如 


1 0 0 0 2 1 1 
N= 2—1 0 0 |, 那么 MT 一 1 一 一直 

0 0 1 一: 

1 0 0 1 


(43.5) 


1 2 一 ! 
1 1 1 


ooor 


换 破 还 了 对 称 公 .。 “ 吕 枯 在 避 一 阶 和 选取 昌 大 的 对 负 线 元 表 《 这 相 
当 于 行列 作 局 样 的 交换 ) 保 持 对 称 性 , 但 是 稳定 性 得 不 到 保证 . 


定点 运算 Cholesky 分 解 的 误 妾 分 析 


44. 我 们 只 讨论 正定 的 情况 ,我 们 证 明 , 如 果 
人 1e <1— (1.00001)27, 


GD 1 = UA > 二 (n + 2)27, (44.1) 
那么 ,用 有 内 积累 加 的 定点 运算 计算 Cholesky 分 解 给 出 的 上 满足 
LLT=A+F, | 1, {44.2) 
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2 二 (> 7), 


hl 2 (7 < (43) 


(1.00001)127: < (1.00001)2™ (7 = 5). 


证 明 是 用 归纳 法 。 假 定 工 的 元 素 我 们 已 经 计算 到 ,ss 一 1 过 
7), 且 这 些 元 案 对 应 (4 十 Fr 的 准确 的 分 解 , 其 中 ,对 
于 5i 所 7 一 1 是 对 称 的 ;一 7 js 一 1 j= i 一 1, 
在 (i,7) 位 置 的 元 素 满足 关系 〈44.2) 和 (44.3), 其 他 是 零 . 于是， 
我 们 利用 (i) 有 

hin A 十 Pow) > baia( A) F bia( Fsse) 


> -i + 2)27 


> 0, (44.4) 

并 且 1(4 二 Fo < 1。 因 此 《4 十 Fw) 是 正定 的 , 其 元 

素 的 模 不 大 于 1 。 所 以 它 有 一 个 准确 的 三 角 型 分 解 ， 其 中 包含 我 
们 已 经 有 的 直到 /的 元 素 . 现 在 我 们 考虑 表达 式 

ge nln bala ee dos (0445) 


x, 
i 


其 中 i 是 我 们 已 经 计算 的 元 索 、 这 个 表达 式 是 (4 十 Fi) 的 
三 角形 分 解 的 《r,s》 元 素 ， 因 此 它 的 模 以 1 为 界 .现在 由 定义 可 
知 ， 记 (>) 是 正确 地 会 人 的 = 值 。 因 此 它 的 模 也 不 大 于 1 。 对 于 
计算 的 4 我们 有 


(ha ee ott) + 


ls 
1 J-e 
(ll< 寺 2 (44.6) 
这 意味 着 
LL), = a + tik, = a + hs (44.7) 
其 中 
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1 


| < 十 2 (44.8) 


对 直到 1,， 为止 的 元 素 我 们 已 经 建立 了 所 要 求 的 不 等 式 ， 要 完成 
归纳 法 的 证 明 , 我 们 还 必需 考虑 对 角 线 元 素 1 的 计算 ,如 果 我 们 
写 
曙 一 ar 一 着 一 只 一 一 rn (44.9) 
那么 y 是 〈4 十 F,,-,) 的 准确 的 三 角形 分 解 的 (r, r) 元 素 , 所 
以 它 落 在 0 到 1 的 范围 内 ， 因 此 ， 
一 
三 3 十 8 (lel < (1.00001)2- 一 ,由 第 三 章 410 得 ). 
{44.10) 
其 中 我 们 慨 定 了 平方 根 的 子 程序 总 是 给 出 不 大 于 1 的 结果 。 因 
此 ， 


=P+2ey+e 
或 者 
天 十 入 十 十 昌 二 ar 十 287 十 时 
Ra 287 + 2 = qr + 28ln, (44.11) 
这 给 出 
(LID, = ar 十 加 《| 加 | (1.00001)1n2™). (44.12) 
现在 我 们 的 结果 已 完全 建立 了 。 
如 果 用 各 ( ) ,我 们 可 以 得 到 类 似 的 结果 。 了 略 去 2 阶 的 元 
索 , 对 应 的 界 本 质 上 是 
15dol2 Cr > 5), 
li dnl2™ (rf < s), (44.13) 
2 (+ = 5), 


病态 短 隆 
和 6. 如 果 大 多 数 5 都 比 1 小 得 多 ,这 些 界 表明 ， 对 绝 大 多 数 
元 素来 说 , 4 与 4 的 差 比 寺 2- 小 得 多 。 并 且 很 可 能 存 三 角形 
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分 名 中 站 和 的 训 关 与 与 必须 用 :位 表示 时 逢 阵 元 素 的 初始 舍 信 产生 


在 表 5 中 我 们 异 冰 了 一 个 十 分 病态 的 秆 阵 如 的 三 角形 化. 这 
个 矩阵 是 用 1.8444 乘 5 阶 的 Hitbert 矩阵 得 来 的 。 这 样 做 是 为 了 
避免 原 短 阵 的 表示 中 发 生 误差 。 计 算是 用 8 位 十 进位 和 ja( ) 热 
行 的 。LL” 与 妃 的 差 也 给 出 了 ， 注 意 ， 它 的 绝 大 多 数 元 素 都 远 远 


小 于 #10“ 数量 级 。 这 个 例子 的 有 趣 的 特点 是 ,在 (LL 一 H) 的 


元 素 中 ， 最 小 的 那些 元 案 的 报 动 对 于 解 有 最 大 的 影响 ， 这 个 结果 
可 以 和 Wilkinson (1961b) 用 有 累加 的 定点 运算 的 结果 根 比 较 . 

我 们 会 看 到 ，(LLT 一 H) 的 元 窒 , 用 祥 点 计算 的 比 定点 计算 
的 更 小 。( 关 于 Hilbert 炬 阵 的 条 件 及 有 关 课 题 , 见 Todd (1950， 
1961). ) 


用 初 靠 Hermite 算 阵 的 三 角形 化 


46. 现在 我 们 转 到 别 的 三 角形 化 方法 ， 其 存在 性 已 在 $15 证 
明 .。 我 们 先 叙述 一 个 属于 Householder〈1958b) 的 方法 。 这 个 方 
法 以 初等 Hermite 矩阵 为 基础 , 为 了 便于 与 第 三 章 837~4$45 的 一 
般 人 性 分 析 作 比较 。 我 们 着 重 讨论 第 (r 十 1) 次 变换 。 全 过 程 有 
(4 一 1) 步 ， 在 第 + 步 完 成 时 4. 的 前 + 列 已 经 是 上 三 角 型 。 我 
们 可 以 写 


(46.1) 


其 中 尺 是 > 阶 上 三 角形 矩阵 ， 在 第 〈* 上 1) 步 中 我 们 用 如 下 形 
式 的 矩阵 P, 代替 Gauss 消去 法 中 的 No。 
T 1 0 
已 一 | 一 一 --- 一 ----- 


D 一 ?orz 


» lell; = 1, (46.2) 


我 们 有 


| V, 
A — PA "| | (46.3) 
(1 一 2007)W 


《8665256Z*0200T 
《469 公 459"0 一 Je01 
91 多 人 0901 
《6TGy80YT?0 一 Je0T 
(EE692L11°0)01 


(9660Y0b1 "0X%-0L 
C1697. 0 ge-ot 
《Z8685z6 00t-0T 
《r66996y "0— Dt-0T 
{2s2sS161° 0)o0T 


11680888 Da-01 
06ZEZ05 "OOT 
(69LE8LI1 "09o0T 
人 
9TO6P ZTE" CIOT 


(58126t¢2°0201 
CC 和 《8E 利 8L8T “02e0T 
《56[y66z79 "02507 C1081Z817*0 "~ 0 (grcepcyb" 00L 
(z6776658°0 — OI C60SPESPSONO 。 《96956967“0 一 0I (E1066F01"0) 0 
wT) 
Cesel 07 -0 
《59Z8ZZr 9-01 《6819zy5S "0)e-0T 
《6056ZPLOL “Da0T 《CZ8S8LITI“0Jo0[ 。 【5ZZ9ZS8"0) -OF 
《86Y&868 07r-O 《8z98EZ8Z 0Jo0E 《OSITf88"0)o0f 《1626226570 一 )a0T 
(H 一 IIT)NT 


《5029098T “025-0T 

《80T04Zy6"0Jr-0T 。 《588066f50-01 

0 (6585665697 04mT 《Sr66yyzZ-02o0T 

《61896085 “9Jo01 人 z58z94 "ON 。 【《z5086y89"0)o0[ 。 《Zr02yzG6"0)c0i 


TI 
tpI1"0 
0910z"0 08922°0 
089ZZ-0 0765Z"9 ObzO5°0 


deesz0 OrZ0E’0 8829£°0 09¢cy°0 
0yZ0g"0 88r96°0 O09gct°0 08b09°0 02206°0. 


《图 装 措 ) 攻 婴 班 邯 三 于 胃 吕 
5 区 
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因此 只 有 WW。-+ 被 修改 。 我 们 应 该 选取 * 使 得 《I 一 2vvT)W。 
的 第 一 列 除了 第 一 个 元 素 外 全 是 零 。 这 恰巧 就 是 在 第 三 章 $37~ 


$45 中 已 经 分 析 过 的 问题 . 0 果 用 
Grrlrtis 加 rp+39p 二 18 "smart (46.4) 
索 示 友 。， 的 第 一 列 元 察 ,为 方便 起 见 略 去 上 标 ,我们 可 以 写 
了 一 2v07 = 1 — wu/2K, (46.5) 
其 中 
Hi 一 Borisrt1 TF 3, Hi rtiortl 全 一 2, 3 如 一 7), 


§ ~ FY aby, ZK HF oiras = Ft,S, (46.6) 
于 是 新 的 《r 十 1，* 十 1) 元 素 是 土 。 为 了 数值 稳定 ,我 们 选择 
符号 使 得 
la 一 larrornl + 5, (46.7) 
修正 的 矩阵 〈7 一 wn?/j2K?)WW。-， 是 由 《7 一 22v7)W，- 计算 的 ， 
其 步骤 是 

pT 一 MT 了 rn/2K2。 (46.8) 

(一 2 We = Wo — wbT. (46.9) 

如 果 已 知 一 个 右 端 或 者 多 个 右 庙 在 执行 三 角形 化 的 第 (7 十 

1) 步 时 我 们 可 以 用 书 乘 当时 的 右 端 。 可 是 如 果 我 们 要 解 的 方程 ， 

其 右 端 在 三 角形 化 之 后 才 决定 ， 那 么 我 们 必须 存储 全 部 有 关 的 信 

息 。 最 方便 的 办 法 是 存储 x 的 (* 一 7) 个 元 素 ,覆盖 在 FV。 的 第 
一 列 占有 的 《n 一 +) 个 位 置 上 。 因 为 从 (46.6) 知 ， 
Wi a 全 一 2 

所 有 的 元 素 除 m 之 外 都 已 经 在 自己 的 存储 位 置 上 。 这 意味 着 我 

们 需要 单独 存储 上 三 角形 矩阵 的 对 角 线 元 素 。 由 于 在 回 代 时 对 角 

线 元 素 的 使 用 与 其 他 元 素 不 同 ， 这 样 做 并 不 是 不 适当 的 。 我 们 世 

要 用 2K? 的 值 ;但 是 这 些 值 可 以 从 关系 2K 一 干 x%3 来 决定 ,如 果 

采用 后 一 个 办 法 ,在 4。 提供 的 位 置 之 外 只 需要 =” 个 额外 的 存储 
位 置 。 我 们 称 这 个 方法 为 Houscholder 三 角形 化 。 
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Householder 三 角形 化 的 误差 分 析 


47. 在 第 三 章 , $42 一 $45 中 给 出 的 一 般 性 误差 分 析 比 House- 
holder 三 角形 化 涉及 的 内 容 更 多 。 事实 上 ， 有 关 的 界 可 以 稍微 缩 
小 一 些 。 在 第 三 章 $45 中 ,对 于 ‖ 4。-: 一 Pe_zPs_4……Podolls 给 出 
了 一 个 界 ,其 中 4,-， 是 第 〈= 一 1) 次 计算 的 变换 ，P, 是 对 应 于 
计算 的 到 的 准确 的 初等 Hermire 短 阵 (下 面 我 们 加 了 一 杠 以 
便于 与 以 前 的 分 析 帮 比较 }。 对 于 我 们 现在 的 旭 的 ,更 有 关系 的 界 
是 4 一 了 ,oP。s'… Bo4o 的 界 . 如 果 

Ar 一 巨 。 :五 。 Podo = F, (47,1) 
那么 ， 

:一 PesBa sr BolAo 十 【五 :五 。， *P) FI]. (47.2) 
因此 我 们 看 出 ，P, 接近 真正 的 初等 Hermite 和 矩 阵 的 重要 性 ， 仅 
仅 在 于 保证 Pr' 是 几乎 正 交 的 ;因而 内 P,P,-*…Bo)"'Fllz 不 
明显 地 大 于 |Fls. 第 三 章 的 (42.3) 中 的 项 (9.01)27" hollz 不 出 现 
在 我 们 当前 的 分 析 中 . 第 三 章 的 关系 式 (44.4) 中 的 项 (3.35)2- 
146ollz 仍 出 现 。 读 者 可 以 验证 ,我 们 有 

4。 一 五 五 (Cd + G), (47.3) 


其 中 
llells < (3.35)(# — DE1 + C9.01)27]" 2 一 4olg。〔〈47.4) 
类 似 好 ， 
Br 一 BP se Polbo 十 天) (47.5) 
UR = 3,35) C5 一 1)[1 + (9.01)2™]" -26 (47.6) 


用 刷 ;; 潼 初等 稳定 矩阵 的 三 角形 化 


48. 在 部 分 主 元 素 Gauss 消去 法 的 第 ” 步 中 ,我 们 可 以 用 比较 
简单 的 矩阵 


Mort eras" s Mar 
的 乘积 来 代替 单个 的 初等 稳定 矩阵 N;， 在 这 种 情况 下 ,第 步 细 
分 为 人 一 +) 小 步 ,每 一 小 步 引进 一 个 零 ， 对 于 ”一 6 的 情况 ,第 
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三 步 的 第 二 小 步 完成 后 拭 阵 的 形式 是 
Wu Md Ws We Hs Me 站 
Wa Wa Hy Hh Hs fas 人 
人 
5 3 M5 A 瑟 
wm a |b 
我 们 用 ws 和 c; 表示 前 两 行 的 元 素 ， 因 为 它们 已 是 最 终 的 结果 。 
当 我 们 按 下 述 步 又 执行 第 + 步 时 就 会 明白 (48.1) 中 的 星 号 的 意 
义 。 
对 于 ;从 (r 十 1 到 轩 
Qi) 比较 ev 和 oi, 如果 jar| > 1ar|， 交 换 元 素 or 和 4 
全 一 rn) 交换 如 和 5 
《iD 计算 er/an 作为 wr 并 覆盖 在 or 上 。 如 果 在 (i) 中 
进行 了 交换 ,那么 就 给 mi, 打上 星 号 。 
(i) 对 于 了 从 (r 十 1) 到 办 
计算 ar 一 mrer 并 覆盖 在 ai; 上 。 
(iv) 计算 如 一 mb, 并 福 盖 在 上. 
实际 上 我 们 可 以 辆 性 每 一 个 mv 的 最 后 一 位 。 如 果 在 计算 ni 之 
前 发 生 交换 ,我 们 在 该 位 记 上 “1{ ”， 否 则 记 上 * 0 ”， 显 然 ,对 于 音 
独处 理 一 个 右 端 ,我 们 已 经 存储 了 足够 的 信息 . 
这 个 算法 在 稳定 性 方面 可 以 与 部 分 主 元 素 的 Gaus 消去 法 比 
美 ,虽然 对 于 4。 的 等 价 摄 动 它 不 可 能 得 到 很 小 的 上 界 。 它 不 适宜 
于 作 内 积累 加 ,并 且 如 前 所 述 ,这 个 方法 几乎 没有 什么 可 以 推荐 在 
部 分 主 元 素 Gauss 消去 法 中 使 用 . 


前 主子 式 的 计算 


49. 重新 安排 $48 的 算法 ,有 很 大 的 好 处 。 重 新 安排 的 方法 也 
有 (a 一 1) 步 ， 但 是 在 前 (7 一 1) 步 中 仅仅 涉及 (4oi6bo) 的 前 
7 行 . 对 于 一 6 rf 一 3 的 情况 , 在 前 (+ 一 1) 步 完成 时 ,矩阵 
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的 形式 为 
Wt A a dn ds qs | bl 
Na ln Gs A ts qn| Bb 
ny 3 da G4 4 0% | bs (49.1) 
an Ag 06 M4 os qs | bs 
第 (+ + 1) 行 是 如 的 没有 修改 过 的 行 ;第 1 行 到 第 + 行 已 经 加 
工 过 .加 工 的 方式 在 下 述 的 第 * 步 的 说 明 中 指出 。 

对 于 从 1 到 ”~ 

人 比较 ow 和 aoriw， 如果 1amvs| > [an| ,那么 交换 mr 
和 aij 一 训 nm) 以 及 5 和 下 

(iD 计算 wuzfar 作为 nenw， 并 覆盖 在 w+ 上 . 如 果 在 
人 i) 步 发 生 交 换 ,那么 给 nriot 打上 星 号 。 

( 首 ) 对 于 了 从 全 十 了 到 
计算 errs 一 w+roiai 并 覆盖 在 sin, 上 。 

(iy) 计算 bn 一 srssb; 并 覆盖 在 b+ 上 。 

这 个 格式 有 两 个 饮 点 。 

(ID) 如 果 不 希 望 保留 ar， 亦 即 如 果 以 后 没有 几 个 右 端 时 加 
工 , 那 么 有 一 个 右 端 的 这 种 情况 下 极 大 的 存储 量 是 

[(s + 1) Fn (sem 1) + 士 3] 士 十 于 
因为 到 需要 最 后 一 个 方程 时 ， 前 (a 一 1) 个 方程 已 经 几 平 简 化 为 
三 角形 了 .。 

《ID) 从 我 们 的 观点 来 看 ， 更 重要 的 是 在 第 * 步 中 , 可 以 计算 
如 的 (r 十 1 只 前 主子 式 ; 并 且 如 果 我 们 希望 不 作 任 何 第 ” 十 2 
到 第 * 行 的 计算 。 我 们 可 以 在 第 ” 步 停止 。(r 十 1) 叭 前 主子 式 
Prt 被 决定 如 下 。 

如 果 保 存 从 第 一 步 起 发 生 的 交换 总 次 数 ,那么 在 第 > 步 结 
东 时 有 


Pr 一 《一 1)keaaar artbrhts (49.2) 
其 中 m 是 当时 的 值 . 
我 们 常常 只 需要 + 的 符号 。 这 可 以 在 第 * 步 得 到 如 下 ; 
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修 定 开始 时 我 们 知道 p, 的 符号 。 那么 每 次 执行 上 述 步 (1) 
时 ,如 果 作 了 交换 ,并 且 a 与 wruy 同 号 ,我们 就 改变 这 个 符号 。 
在 完成 第 步 之 后 ,如 果 mrwr 是 负 的 。 我 们 再 改变 一 次 符号 。 
用 $48 的 算法 能 得 到 这 些 子 式 ， 但 是 我 们 叙述 的 这 个 方法 更 
为 方便 ， 如 采用 部 分 主 元 素 或 完全 主 元 素 Gaos 消去 法 以 及 用 
Householder 三 角形 化 ,一 般 地 都 不 能 得 到 这 些 前 主子 式 。 


用 平面 旋 装 的 三 角形 化 


50. 最 后 我 们 考虑 用 平面 省 转 的 三 角形 化 《Givens，1959). 这 
种 方法 与 用 Mj 为 基础 的 算法 十 分 接近 。 我 们 有 一 个 类 似 于 $48 
的 算法， 其 中 第 步 由 分 别 左 莱 在 平面 (+, 7 十 D)，(r,r 十 2)， 
… (7,#) 上 的 旋转 组 成 ， 第 * 列 中 的 零 是 一 个 一 个 产生 的 。 第 
+ 步 如 下 ,。 (注意 ,与 $48 的 十 分 类 似 ) 

对 于 i 从 (r 寺 1) 到 n: 

(CD 计算 * 一 (a2 十 a 

(iD 计算 cos6 一 qjx，sin9 一 gi/x， 如果 * 一 0, 取 
cos0 二 1，sin8 一 0. 把 * 履 盖 在 mw， 上 、 

《ii 对 于 了 从 (r 十 1) 到 2: 
计算 arcosg 十 sysin 和 一 ersing 十 aijcos8 并 分 别 获 芋 在 ori 
和 sr 上 。 

注意 ,因为 cos9 和 sin0 都 必需 容纳 ,我 们 没有 余地 把 每 一 个 省 
转 的 信息 存储 在 元 素 已 化 为 零 的 位 置 中 。 诚然 ， 我 们 可 以 只 存储 
这 两 个 信息 中 的 一 个 , 男 一 个 再 重新 推导 出 来 ,但 这 不 是 有 效 的 . 
如 果 要 保证 数值 稳定 性 ， 我 们 必须 存储 数值 上 较 小 的 那个 并 记 住 
这 两 个 中 哪 一 个 被 存储 了 1 

51. 这 个 变 痪 可 以 重新 安排 , 它 类 似 于 $48 叙述 的 重新 安排 的 
方法 。 在 这 种 新 格式 中 ， 前 (+ 一 1) 步 不 改变 第 (+ 十 1) 到 第 = 
行 . 第 * 步 如 下 : 

对 i 从 1 到 +r: 

(GD 计算 太一 (4 十 qi)。 
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(ii) 计算 cosg 一 arfx，sing 一 orrorfz。x 覆 苹 在 o 上 。 

(省 ) 对 7 从 (i 二 1) 到 a: 
计算 areos6 十 aruising 和 一 aising 十 wsurjcos6， 分 别 覆 盖 
在 mi 和 arrof 上 . 

《iv) 计算 beosg -+ osinrg 和 一 bisin 9 十 bncos9, 并 分 别 
材 盖 在 & 和 br 上 。 

因为 每 一 个 旋转 矩阵 的 行列 式 都 是 二 1, 因此 在 第 * 步 完成 为 
(r 士 让 阶 的 前 主子 式 的 行列 式 pw 为 

Pin 102 Arztl (51.1) 

用 平面 旋转 的 三 角形 化 ,无 论 其 格式 是 像 $50 的 ,还 是 我 们 刚刚 描 
述 的 那样 ,都 称 为 Givens 三 角形 化 . 


Givens 约 化 的 误差 分 析 


52. 在 第 三 章 $$20 一 36 中 给 出 的 误差 分 析 已 充分 概括 了 Gi- 
vens 三 角形 化 ,与 Householder 三 角形 化 一 样 ， 甚 界 可 以 稍为 缩 
减 。 

对 于 标准 的 浮 点 计算 ,我 们 能 够 证 明 ,假如 最 后 计算 得 的 方程 
组 是 wz = By, 那么 


An 一 Rn: .RR( Ao + G), (52.1) 
By 一 Ry ** RR,(b, +g), (52.2) 
其 中 
HGlle < ollAls, gl < el (52.3) 
并 且 
42 [1+ 6.27 1 
a < 3n127: [二 | (52.4) 


对 于 使 = 明显 地 小 于 1 ， 等 价 的 摄 动 的 Euclid 范 数 实际 上 是 以 
Kn?2- 咱 4olls 为 界 的 任何 4, 关于 9 的 最 后 一 个 因 于 是 不 重要 的 ， 

对 于 定点 计算 ,利用 逐次 引进 的 零 元 始终 保持 为 零 的 特点 ,可 
以 改善 第 三 章 的 结果 ,此 外 ， 根 据 第 三 章 的 分 析 作 一 -个 简单 的 推 
导 可 知 ， 如 果 每 一 列 都 引信 比 例 因 子 使 得 它 的 2 范 数 小 于 
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1 一 二 2 (比如 说 )， 


那么 在 约 化 过 程 中 没有 一 个 元 素 会 超出 范围 ， 因 些 ， 如 果 我 们 只 
用 2 的 禾 作 比例 因子 ,我 们 也 能 保证 


主人 (525) 


而 且 在 计算 中 没有 超过 数 信 范 围 的 危险 . 事实 上 ， 用 这 种 比例 因 
子 , 每 一 列 的 2 范 数 在 每 一 阶段 都 保持 小 于 1 。 在 4。 上 的 等 价 
摄 动 的 界 可 以 用 多 种 方式 来 表示 ,但 是 用 这 种 比例 入 子 的 ,我 们 自 
然 有 


lls <3ai2 < 3m27 "aols/(1 一 三 om 52.0) 


类 似 地 ,如 果 和 以 同样 的 方式 引进 比例 因子 ,我 们 必定 有 
上 lg 有 < 0.4m27 < 0.8m727" lla. (52.7) 
正 交 三 角形 化 的 唯一 性 


53. 如 果 我 们 用 97 表示 用 Givens 或 者 用 Househotder 三 角 
有 形 化 引进 的 正 交 变换 矩阵 的 乘积 ,我 们 得 到 


QT4,=—U, (53.1) 
中 87 是 正 交 和 矩阵，U 是 上 三 角 型 。 我 们 可 以 写 为 
如 一 0U。 《53.2) 


现在 我 们 证 明 , 如 果 4 是 非 奇异 的 并 且 表 示 为 《53.2) 的 形 
式 ,那么 2 和 习 在 本 质 上 是 唯一 的 .事实 上 若 
QU, = QU,, (53.3) 


则 有 
QQ. = UU mV. (53.4) 
因此 ,VV 也 是 上 三 角 型 ，U, 的 非 奇异 性 是 因 4。 的 非 奇 异性 得 到 
的 。 既然 0719， 是 正 交 的 ,因而 
ViV=1. (53,5) 
上 式 两 边 的 元 素 相等 ,我 们 发 现 了 必定 是 如 下 形式 ; 
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V=D= digldi), di™— +l1. (53.6) 
因此 ,除了 与 8 的 列 和 的 行 相关 联 的 符号 之 外 ,分 解 (53.2) 是 唯 
一 的 ,类 似 地 ,如 果 如 是 复 的 、 非 奇异 的 :我们 可 以 证 肖 除了 元 素 
的 模 是 一 的 对 角形 因子 之 外 ,本 三 角形 分 解 是 唯一 的 . 
读者 可 能 想 知道 在 Giveas 三 角形 化 中 ,在 第 * 列 产生 零 元 的 
旋转 和 矩阵 的 乘积 是 否 等 于 在 Householder 方法 中 产生 同样 的 零 元 
的 初等 Hermite 矩阵 。 如 果 我 们 考虑 在 第 一 列 引进 零 元 的 旋转 。 
马上 可 以 看 出 ,它们 并 不 相等 。 这 些 旋转 是 在 平面 
{1,2), (1,3),° °°,(1,n) 
上 的 . 对 于 ”一 6 的 情况 相应 的 矩阵 乘积 的 形式 是 
x x x x x x 


(53.7) 


X X X X X 
XXXXXX 
XXXX 
X XXXS 口 
xx 虽 = = 
xccoc = 


在 指明 的 位 置 上 总 存在 由 零 元 构成 的 三 角形 ， 而 另 一 方面 , 在 
Householder 交换 中 ,第 一 个 矩阵 通常 在 这 些 位 置 上 没有 零 元 ， 并 
且 总 是 对 称 的 。 


Schmidt 正 交 化 
54. 如 果 我 们 对 (53.2) 中 对 应 的 列 列 等 式 ,那么 得 到 


a Wud, 


Ga 一 W292 十 ttz292y (54.1) 


Gar Mg tag tt + Gy 
其 中 a 入 分 别 表 示 4 积 吕 的 第 + 列 。 我 们 可 以 利用 这 些 等 式 
和 正 交 条 件 来 决定 9 和 wi* 过 程 由 步 组 成 ,在 第 了 步 ,用 前 面 计 
算 的 量 决定 mr，ww ,wr 和 94。 事实 上 ,我 们 有 
wir = gfar (i = 1 Oo 1), (54,.2) 
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rr 一 ar — warg 一 一 wave (54.3) 
第 二 个 等 式 表明 存在 一 点 自由 度 。 在 复 的 情况 下 我 们 可 以 取 任 意 
一 个 模 为 1 的 复数 来 代替 土 。 从 4 决定 正 交 组 qi 通常 称 为 
Schmidt 正 交 化 过 程 
55. 用 准确 的 运算 ，Schmidt 过 程 给 出 的 矩阵 0,U 与 Givens 
或 Householder 方法 给 出 的 是 一 致 的 《不 计 符 号 的 差别 )。 可 是 ， 
在 实际 上 , 用 等 式 (54.1) 到 (54.3) 导 出 的 矩阵 8 与 Givens 的 或 者 
Householder 方法 的 变换 阵 的 转 冒 相 羔 得 到 的 矩阵 可 能 完全 不 同 。 
从 第 三 章 的 误差 分 析 我 们 知道 ， 尽 管 我 们 很 少 会 去 形成 后 一 种 矩 
中 的 乘积 ， 但 是 它 对 任何 适当 的 ”都 应 非常 接近 于 正 交 和 矩阵 。 然 
而 , 用 (54.1) 到 (54.3) 得 到 的 向 量 gj 可 能 任意 地 偏离 正 交 性 ， 
年 一 看 ,这 似乎 十 分 惊人 ,因为 Schmidt 方法 是 专门 用 于 产生 
正 交 疝 量 的 。 可 是 ,我 们 考 起 二 阶 矩 阵 
, [97 056154|， 
0.31256 0.27740. 
在 Schmidt 方法 中 ,第 一 步 给 出 
tt 一 0.70558, gT = (0.89652, 0.44298); (55.2) 
第 二 步 给 出 wa 一 0.62631。 所 以 我 们 得 到 
zag 了 一 af 一 wna9! 一 《0.00004， 一 0.00004)。 (55.3) 
在 (55.3) 右边 的 计算 中 。 发 生 严 重 的 相约 , 计算 的 结果 相对 误差 
大 。( 不 管 定点 或 者 是 浮 点 都 是 如 此 , ) 因 此 ,规范 化 右边 的 向 量 给 
出 9。 它 甚至 并 不 近似 地 正 交 于 qu! 这 个 使 我 们 确信 这 种 现象 与 
短 阵 的 阶 数 高 恢 无 关 , 也 不 能 认为 ， 它 是 “大 量 合 人 误差 的 积累 带 
来 的 影响 ”。 
息 然 要 问 , 从 Givens 或 者 Householder 方法 得 到 的 计算 的 正 
交 阜 阵 是 否 逼 近 用 上 述 三 个 方法 作 准 确 计 算 产生 的 唯一 的 正 交 和 抵 
阵 呢 .回答 是 :一 般 来 说 我 们 不 能 保证 .我 们 在 第 三 章 的 误差 分 析 
保证 这 些 矩 隆 * 几乎 正 交 ”， 但 是 它们 并 不 逼近 相应 的 准确 计算 的 
惩 阵 【在 第 五 章 $28 中 ， 我 们 将 通过 正 交 相似 变换 来 说 明 这 一 
点 ,) 在 某 些 计算 中 , 9 的 正 交 性 是 极为 重要 的 。 例 如 ， 在 对 称 矩 


253 。 


(55.1) 


阵 的 OR 算法 中 《第 八 章 )， 导 出 矩阵 4 的 27 分 解 之 后 要 计算 
撼 阵 U9， 因为 我 们 有 79 一 97(8U)8 一 0408， 这 样 导 出 
的 拭 阵 是 4 的 一 个 相似 变换 。 但 是 , 仅 当 台 是 正 交 时 , 它 才 是 对 称 
的 .刚才 我 们 讨论 的 Schmidt 方法 的 现象 在 研究 解 特征 值 问题 的 
Arnoldi 的 方法 时 还 要 涉及 到 (第 六 章 , $32)， 

Schmidt 方法 需要 的 策 法 量 是 w’, 然 而 Householder 和 Givens 


三 角形 化 需要 的 分 别 是 三 如 和 和 吧 。，Householder 和 Givens 方 
法 给 出 的 正 交 特 阵 的 确 仅 仅 是 因子 的 形式 。 但 是 ， 在 实际 上 这 种 
形式 常常 更 方便 。 计 算 Houscholder 变换 的 乘积 还 需要 2 次 


先 法 ,因此 即使 需要 正 交 人 矩阵 本 身 ，Householder 方法 也 是 十 分 经 
济 的 。 此 外 ， 如 果 我 们 希望 用 Schmidt 方法 得 到 一 个 “ 正 交 性 比 
较 好 ”的 矩阵 ,在 每 一 个 阶段 向 量 的 再 正 交 化 是 必 不 可 少 的， 为 此 
需要 增加 ?次 乘法 ( 见 第 六 章 )。 


三 角形 化 方法 的 比较 


56. 现在 我 们 来 比较 用 稳定 的 初等 变换 和 用 初等 正 交 变 换 的 
方法 。 
对 于 正定 对 称 害 降 的 情况 三 角形 化 方法 的 选择 是 十 分 肯定 
的 。 对 称 的 Cholesky 分 解 其 有 许多 优点 。 不 需要 交换 ,用 定点 运 
算 可 以 方便 地 执行 .应 用 给 定 精度 的 计算 ,如 果 有 内 积累 加 ,其 误 
差 的 界 小 得 像 任何 方法 可 能 期 望 的 那样 小 。 它 充分 利用 了 对 称 性 
的 优点 并 只 需要 m16 次 葬 法 . 值得 注意 的 是 ,不 计 合 人 误差 ,我 们 


有 4 一 也 LI， 并 且 4 = (LL (56.1) 


因而 ， 

A i {56.2) 
在 此 , 世 的 谱 条 件数 等 于 4 的 谱 条 件数 的 平方 根 是 最 令 人 满意 的 
情况 ， 如 果 4 是 带 型 的 , 区 or 一 (li 一 尖 之 和 ,那么 信守 0 
(i 一 逢 之 旭 ， 所以， 这 种 形式 利用 了 全 部 优点 , 存在 唯一 的 非 
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议 也 许 是 它 需 要 ” 一 1 个 平方 根 ， 而 普通 的 Gauss 消去 法 , 一 个 
平方 根 计算 也 不 村. 

57. 现在 我 们 转 到 更 一 般 的 情况 ,这 时 判定 那 一 个 方法 好 就 不 
那么 明确 ， 如 果 和 矩阵 完全 是 一 般 性 的 ， 我 们 讨论 过 的 四 个 方法 的 
计算 量 大约 如 下 : 


(CD 部 分 主 元 罕 世 完 全 主 元 素 Gauss 消去 法 : 二 ”次 乘法 。 
(CD 用 形 如 Mi 的 短 阵 三 角形 化 ， 二 次 乘法 。 


(Im Houscholder 三 角形 化 ， 地 夏 次 蔷 法 ，n 次 开 方 ， 


{IY) Givens 三 角形 化 ; 4 乘法 。 玛 邓 次 开 方 


在 速度 方面 ,方法 (D 和 (ID 比 (ID 和 (ITV7 优 越 并 且 比 较 简单 。 
在 许多 计算 机 上 , (7) 和 (1) 可 以 用 双 精 度 执行 ,所 花 的 时 间 与 (IV) 
用 单 精度 执行 时 差不多 。 让 垮 的 是 ,就 数值 稳定 性 来 说 ,从 严格 的 
理论 观点 来 看 ，( 了 和 (了 1) 是 相当 不 满意 和 的， 我 们 已 经 看 到 ， 如 果 
我 们 用 部 分 主 元 素 ， 最 后 一 个 主 元 素 可 能 达到 原 和 矩阵 极 大 元 素 的 
2 倍 . 因此 ,对 于 在 厌 矩 阵 上 等 价 的 摄 动 ,我 们 所 能 得 到 的 一 个 
严格 的 先 验 的 上 界 包 含 了 因子 2"…' 可 是 ,经 验 表明 ,虽然 这 个 界 
是 可 以 达到 的 ,但 是 对 于 实际 的 计算 它 是 很 不 合适 的 ， 事实 上 , 主 
元 素 的 增长 现象 根本 不 是 经 常 发 生 的 ,如 果 能 用 内 积累 加 ,在 原 矩 
阵 上 的 等 价 拉动 是 异常 小 的 。 

对 于 完全 主 元 素 Gauss 消去 法 , 我 们 对 于 主 元 素 的 极 大 增长 
得 到 的 界 是 要 小 得 多 的 ,并 且 有 充分 的 理由 相信 这 个 界 不 能 达到 . 
可 惜 这 个 方法 似乎 不 能 利用 内 积累 加 的 优点 ， 因 此 在 有 这 种 设备 
的 计算 机 上 必然 考虑 用 部 分 主 元 素 方法 而 不 顾 潜 在 的 危险 ， 幸 而 
对 某 些 在 特征 值 问题 中 很 重要 的 矩阵 类 ， 部 分 主 元 素 增长 的 界 比 
一 般 矩 阵 的 小 得 多 。 

就 正 交 三 角形 化 来 说 ，Householder 方法 在 速度 方面 优越 于 
Givens 方法 ; 在 精度 方面 ;除了 可 能 利用 标准 浮 点 计算 之 外 ,一 般 
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地 也 是 如 此 。 这 两 个 方法 都 无 条 件 地 保证 数值 稳定 ， 原 矩 路上 的 
等 价 摄 动 的 党 验 的 界 是 最 令 人 满意 的 ， 不 计 命 人 误差 ， 每 一 列 的 
2 范 数 保持 为 常数 ， 因 此 在 简化 过 程 中 不 会 有 元 素 增 大 的 任何 危 
险 


58. 如 果 工 作 小 心 谨 惰 又 有 一 台 过 度 很 高 的 计算 机 ,人 们 可 能 
倾向 于 用 Householder 的 方法 进行 一 般 的 三 角形 化 。 在 实际 上 ， 
我 宁愿 置 一 点 都 分 主 元 素 可 能 增长 的 风险 使 用 部 分 主 元 素 Gauss 
消去 法 。 我 要 这 样 做 的 最 大 原因 ， 是 我 使 用 的 计算 机 有 内 积 紧 加 
的 装置 ， 用 这 种 手 芭 得 到 的 结果 其 精确 度 一 般 高 于 用 Houscholder 
方法 的 。 对 于 Hessenberg 和 矩阵 ,甚至 最 小 心 的 计算 工作 者 也 宁愿 
用 部 分 主 元 素 Gauss 消去 法 ， 对 于 三 对 角 矩 阵 就 更 没有 任何 理由 
使 用 Householder 方法 了 。 

如 果 三 角形 化 的 目的 是 为 了 计算 ” 个 前 主子 式 ， 那 么 I 和 王 
是 不 采用 的 。 摆 在 我 们 面前 的 问题 是 选择 Givens 方法 ， 还 是 选 
择 My 型 的 矩阵 ,前 者 保证 稳定 性 但 是 需要 的 乘法 量 是 后 者 的 四 
倍 。 在 实际 上 我 还 是 宁愿 用 后 者 ， 因 为 不 稳定 的 机 会 实在 是 比较 
少 的 .值得 注意 的 是 ,这 两 个 方法 都 不 能 利用 内 积累 加 的 方便 . 道 
慎 者 可 能 仍然 宁愿 用 Givens 方法 , 除非 矩阵 是 Hessenberg 型 或 
者 是 三 对 角 型 。 值 得 提出 的 是 , 方法 卫 可 以 用 双 精 度 实现 ， 花 费 
的 时 间 与 Givens 的 单 精度 的 大 致 相同 ， 并 且 几 乎 必然 地 给 出 精 
度 高 得 多 的 结果 . 

在 本 书 中 我 们 多 次 明 到 我 们 刚 讨 论 的 各 种 选择 。 也 许 我 们 这 
样 说 是 正确 的 , 正 交 变换 与 其 他 的 初等 变换 相 比 , 它 在 当前 讨论 的 
问题 中 显示 的 优越 性 比 在 以 后 的 问题 中 呈现 的 少 。 


向 后 回 代 


59. 读者 可 能 感到 毅 饶 ,我 们 在 做 向 后 回 代 之 前 就 进行 三 角形 
化 方法 的 比较 。 我 们 这 样 做 有 两 个 原因 首先， 如果 我 们 只 是 为 
了 行列 式 计算 ,那么 用 不 着 向 后 回 代 , 其 次 是 向 后 回 代 产生 的 误差 
没有 我 们 想像 的 那么 重要 。 
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因为 我 们 在 Wilkinson (1963b)，p. 99~107 中 已 经 非常 详细 
地 讨论 了 这 个 问题 。 所 以 ， 这 里 我 们 只 作 一 个 十 分 简明 的 分 析 。 
考虑 求解 方程 组 

Lx =b, {59.1) 

它 的 系数 矩阵 是 一 个 下 三 角形 拒 阵 工 〈 不 一 定 是 单位 下 三 角形 抵 
阵 )。 上 三 角形 方程 组 的 解 是 完全 类 似 的 。 假定 已 经 用 有 累加 的 
浮 点 运算 从 前 面 的 (+ 一 1) 个 方程 计算 了 zs xz …，x-o 那么 
入 给 定 为 

w= foliar ~ or 一 bie + br) /ler] 

三 [一 pari(1 二 e) 一 fom(I 十 B) 一 … 
— rsa tt Br) + bl + Er)] X (1+ efln. 


(59.2) 
从 第 三 章 59, 自然 有 
terl < 卫 (r 一 二 22。 
ssl <22%, lel <27, (59.3) 


如果 我 们 用 (1 十 6,) 除 分 子 和 分 母 ,就 可 写 
zr {latl + %) — lara 1 + 9) 
— hit + rt) + bin(l + 7), {59.4) 


这 里 必定 有 
hat < 三 Gr it 3)2-2a19| 一 2-(100000)， (59.5) 


用 i(1 十) 乘 (59.4) 并 重新 安排 式 子 , 我 们 得 到 
al + am) tial + ms hl + rr 
二 nll + nn) 一 加， (59.6) 
这 证 明了 计算 的 zi 准确 地 满足 系数 为 in(1 十 2) 起 一 1 
+ 一 1) 和 zl 十 入 的 方程 ,除了 1 的 相应 摄 动 可 能 是 量 级 
2-' 之 外 ,在 所 有 系数 上 的 相应 的 扰动 都 是 2 数量 级 . 所 以 计算 
的 向 量 * 满足 关系 
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( 工 十 5L)x 一 六 (59.7) 
其 中 江 是 二 的 函数 ， 但 是 ,正如 对 ?一 5 的 情形 (59.8) 中 表明 的 
那样 , 它 总 是 一 致 有 界 的 。 


lisl 
lizl 
IL] < 2-"(1.00001) lisl 
ll 
lissl 
0 
4lial 0 | 
+22m sal 4 0 . 
élial Sliol 4lisl 0 | 
Tia] 6lisl Slisl 4lisl 0 


(59.8) 
60. 这 是 矩阵 分 析 中 最 令 人 满意 的 误差 界 之 一 。 如 果 我 们 考 
察 一 下 剩余 向 量 , 就 会 明白 它 是 多 么 地 出 色 。 我 们 有 


5— Lx= 6Lr, (60.1) 
因而 
Ws— Ixl < lsrllzl. (60.2) 
如 果 工 的 元 素 以 1 为 界 , 那 么 对 于 1,2,0 范 数 我 们 必定 有 
lsil < 2-"(1.00001) + D2 十 3) (60.3) 


如 果 zz2” 人 1, 第 二 项 是 可 忽略 的 。 
现在 考虑 在 浮 点 运算 中 用 准确 的 解 x 人 金 人 到 “ 位 所 得 的 向 
量 #。 我 们 可 写 


天 一 te 十 小 {60.4) 

显然 
lel 和 2 和 zc (60.5) 

因此 
sb— Li — Lx tad) Ld, {60.6) 
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因此 得 

WB — Lals — Nal < 上 Elail < o2- We C60.7) 
不 难 找 出 达到 这 个 界 的 例子 。 这 表明 。 我 们 能 够 期 间 
组 的 计算 解 的 利 余 小 于 多 的 王 确 售 人 的 得 信 


三 角形 方程 组 的 计算 解 的 高 精度 


61. 在 上 一 节 中 我 们 给 出 了 计算 解 的 剩余 的 界 .。 虽然 这 是 出 
色 的 界 , 但 是 当 工 是 十 分 病态 时 , 它 仍然 对 解 本 身 的 精度 给 出 了 过 
低估 计 。 我 们 已 经 证 明了 计算 的 > 满足 (59.7) 并 对 8L 给 出 一 个 
界 (59.8)。 从 这 些 结果 我 们 导出 的 只 是 
z= (Lt) B= (+ L857L-b. (61.1) 
因此 ,假如 1 上 "85 < 1 我 们 有 ， 
lx 一 LB < LL ~ ILS. (61.2) 
疙 今 为 止 , 每 当 我 们 有 了 这 类 估计 ,我 们 就 用 上 L735 来 代替 
此 ”3 ， 通 常 这 决 不 是 严重 的 高 估 。 可 是 对 于 我 们 实际 的 计算 
却 不 是 如 此 ， 
事实 上 , 略 去 带 2-* 的 部 分 我 们 有 
| < LL <27{|L dag(llal)], (61.3) 
现在 ，L"! 的 对 角 线 元 窒 是 111i:, 所 以 方 括号 内 的 矩阵 是 单位 下 
三 角 型 ,假定 上 ~ 的 元 窒 对 某 个 玉 满 足 关系 


I KI Gi>7)), {61.4) 
那么 (61.3) 给 出 
上] < 27°KT, {61.5) 
其 中 了 是 下 三 角形 矩阵 ,每 个 元 素 都 是 1.。 因此 
人 已 私 22 开 。 《61.6) 
类 似 地 , 如 果 我 们 解 上 三 角形 方程 组 
Uz = b, (61.7) 
计算 的 解 满足 
(U + 50)z 一 加 (61.8) 


其 中 忽略 了 2 22 阶 的 项 , 8 是 对 角 和 矩阵 。 因 此 
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i800 < 2-(1.00001 ) |as;|. (61.9) 
同样 ,如 果 
[UD KIT G 到 访 ， (61.10) 
那么 我 们 有 
luievl, < 2-nK, (61.11) 
对 于 许多 十 分 病态 的 三 角形 和 矩阵，K 是 1 的 数量 级 。 $45 的 
工 7 就 是 一 例 。 这 个 上 三 角形 矩阵 当然 可 以 取 天 一 2,5, 因而 尽管 
5L7 是 十 分 病态 的 。 工 7 的 计算 的 逆 可 以 很 接近 真 的 逆 ， 事 实 上 ,在 
任 一 分 量 上 的 极 大 误差 小 于 最 大 元 素 的 最 后 一 个 有 效 数 位 上 的 1. 
值得 注意 的 是 ,对 于 相应 的 下 三 角形 矩阵 工 ;K 的 什 是 十 分 大 的 。 
62. 为 了 着 重 指出 高 精度 并 不 限于 具有 (61.4) 性 质 的 矩阵 , 现 
在 我 们 考虑 那些 性 质 几 乎 相反 的 矩阵。 假定 工 是 下 三 角形 ， 并 且 
有 正 的 对 角 线 元 素 和 负 的 非 对 角 线 元 素 。 我 们 证 明 ， 如 果 是 元 
素 为 非 负 的 右 删 ， 那 么 不 管 了 如 何 将 检 ， 所 计算 的 角 只 有 小 的 相 


对 误差- 
记 ? 为 准确 解 , x 为 计算 解 ,定义 满足 关系 
x = yl + E,). 《62.1) 
现在 我 们 来 证 明 


3 
-2 2 1l+E 
wn 

<(l 二 2 人 二 过 2 (022) 


对 于 误差 的 界 暂时 保持 这 个 形式 是 方便 的 。 我 们 用 归纳 法 证 明 。 
假定 直到 x,-s 结 论 是 正确 的 .现在 ” 由 (59.2) 给 出 ,从 第 三 章 $8 
我 们 可 用 下 述 更 严格 的 界 来 代替 (59.3)，、 
EA | 3 a 

人 2 sira< (+ 2 ), | 

(1 这 2 ltee 好 十 到 2 (62.3) 

1 
记 住 Gi < >) 是 负 的 , mw 和 % 显然 是 非 负 的 ，” 的 表达 式 是 
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非 负 项 的 加 权 平 均 , 从 我 们 的 妇 纳 法 恨 定 可 看 出 8, 满足 界 (62.23。 

容易 规定 有 任意 高 条 件数 的 这 类 和 矩阵， 注意 ,为 了 求 工 的 逆 ， 
我 们 取 。 到 。。 为 = 个 右 端 ， 它 们 都 是 出 非 负 元 素 组 成 . 因此, 计 
算 的 道 的 元 素 全 都 只 有 小 的 相对 误差 。 读 者 可 能 认为 ， 我 们 刚才 
给 出 的 论证 是 有 偏向 的 。 然而 公认 这 是 正确 的 。 值得 强调 的 是 ， 
一 般 三 角形 矩阵 的 计算 解 的 精度 比 从 剩余 向 量 的 界 推 导出 来 的 要 
高 得 多 。 在 实际 上 这 高 精度 经 常 是 重要 的 . 

我 们 已 经 分 析 的 只 是 用 浮 点 累加 的 情况 ， 对 于 其 他 的 计算 形 
式 , 所 得 的 上 界 稍微 差 一 些 ,但 是 保持 着 同样 的 重要 特点 ，Wilkin- 
son (1961b) 和 Wilkimon (1963b), p.99~p.107 已 经 给 出 了 详细 
的 分 析 . 


一 般 的 方程 组 的 解 


63, 现在 我 们 转向 一 般 的 方程 组 
xy 号 (63.1) 
的 解 ， 假 定 4 已 经 用 某 种 方法 三 角形 化 了 ， 我 们 有 矩阵 工种 使 
得 
LU=A+F, (63.2) 
其 中 了 的 界 依赖 于 三 角形 化 的 具体 情况 .如 果 使 用 了 某 种 主 元 素 ， 
那么 4 表示 已 作 了 适当 行 置 换 的 原 抵 阵 ， 要 完成 解法 ， 我 们 必需 
解 两 个 三 角形 方程 


Ly=b 和 Ux=y, (63.3) 
如 果 用 * 和? 表示 计算 解 ,对 于 有 累加 的 浮 点 运算 ,我 们 有 
(L+oL)y=6 和 (UtoU)r = y, (63.4) 


6 的 界 如 (59.8) 给 出 ,对 于 5 也 有 相应 的 界 。 溉 此 计算 的 x 满 
是 
(L+EL)U + 6U)z = 6, {63.5) 
即 
{4+ G)r= 6b, (63.6) 
其 中 
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G=F+HLU+ LeU + 8LoU, (63.7) 
如 果 我 们 假定 1aw| 所 1, "使 用 部 分 主 元 素 ,UU 的 元 素 的 寞 以 1 为 
界 ,那么 对 于 有 累加 的 浮 点 计算 ,我 们 有 
LGlls < 27 + (1.00001)27’n + (1.00001)2™n + O(n27). 
(63.8) 
因此 ， 只 要 ”2 明显 小 于 1, GI。 的 界 谎 近 似 为 3. 2"n。 值 
得 注意 的 是 这 个 界 的 三 分 之 一 来 自 三 角形 化 的 误差 。 另外 的 三 分 
之 二 来 自 三 角形 方程 组 的 解 。 
从 (63.6) 我 们 有 
rb— Ar= Gr < ollzls < (3.1)27"nlzle. 
(63.9) 
当 wr2 < 之 0.01( 比 方 说 ), 最 后 的 界 必定 成 立 ， 所 以 ,对 于 剩余 我 


是 十 分 病态 的 ,那么 计算 的 解 通常 是 很 不 精确 的 ， 然 而 ,尽管 lzl- 
是 1 的 数量 级 ,但 剩余 至 多 是 2 数量级， 这 表明 ,对 于 388 模 的 
数 最 级 不 大 于 x2 计算 的 x 是 4x 一 上 5 十 86 的 准确 解 。 和 $60 
一 样 , 把 这 个 剩余 解 的 正确 合 人 对 应 的 剩余 作 一 比较 是 有 益 的 ,这 
个 剩余 的 模 的 上 界 是 x2lxlis, 因此 对 应 于 计算 解 的 界 (63.9) 只 
是 三 倍 那么 大 。 


一 般 矩 阵 的 逆 的 计算 


64. 取 5 依 次 为 “eco 我 们 得 到 4 的 六 的 个 计算 的 

列 。 对 于 第 * 列 mw， 我 们 有 
(L + 6L)(U + 8U)x, = es, (64.1) 
这 里 我 们 写 册 55, 和 6U,， 为 的 是 强调 对 每 一 个 右 沿 的 等 价 摄 动 
是 不 同 的 ;虽然 正如 (59.8) 所 表明 ,它们 都 是 一 致 有 界 的 。 我 们 令 


AX—1I=K, (64.2) 
并 且 用 8L. 和 #U, 的 一 致 的 界 ,我 们 发 现 必定 有 
用 ll < (3.1)22" XI 若 ?27 < 0.01, (64.3) 


如 果 | 长 je 小 于 1, (64.2) 意味 着 4 和 XX 都 不 是 奇异 的 。 在 这 种 
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情况 下 ,我 们 有 


下 一 4 一 4 (64.4) 

因而 
x ~ A < (3.1)#27|A™ ol Xs, (64.5) 

并 且 
站 有 < ATH/ [1 — (C3.1)227"A rl. (64.6) 

由 (64.5) 我 们 有 
上 — A Ams (3.1)n274 "1 

一 (3.1)22 4 (64.7) 


从 这 个 结果 ， 我 们 得 出 如 下 结论 : 如 果 我 们 用 有 累加 的 浮 点 
运算 和 带 有 交换 的 三 角形 分 解 计算 4 的 逆 ， 并 且 没 有 一 个 品 的 元 
素 超 过 1， 那么 只 要 计算 的 X 是 使 得 (3.1)w2" 小 于 1 的 ,关系 
《64.6) 和 (64.7) 就 都 满足 ， 特 别 是 如 果 这 个 量 小 ,那么 (64.5) 表 明 
计算 的 天 相对 误差 小 。 反之, 任何 使 〈3.1) "22 4 < 1 成 立 
的 规范 化 矩阵 ,只 要 主 元 素 不 增长 ,必定 给 出 满足 (64.7) 的 计算 的 
x 


可 惜 ,关于 主 元 素 增 长 的 那 旬 话 是 必须 要 加 进去 的 ,但 由 于 这 
样 的 增长 是 很 少 发 生 的 ， 这 个 条 件 在 实际 上 并 不 是 很 大 的 限制 . 

对 于 其 他 低 精度 的 计算 方式 我 们 有 对 应 的 界 ， 当 然 它 是 比较 
差 一 些 ,但 是 根据 绕 计 的 效果 ,我 们 刚才 给 出 的 上 界 在 实际 上 通常 
不 会 超过 的 ， 


计算 解 的 精度 


65. 我 们 注意 到 ,对 于 甜 阵 的 逆 ， 我 们 得 到 的 结果 比 线 性 方程 
组 的 潢 意 得 多 。 原 因 是 小 的 剩余 矩阵 (4X 一 1) 必定 推出 六 是 好 
的 逆 , 而 一 个 小 的 剩余 商量 (4x 一 45) 不 一 定 表示 x 是 好 的 解 . 实 
际 上 。 当 我 们 已 用 任 一 种 技术 计算 了 拱 定 的 逆 X 后 ， 我 们 可 以 计 
算 (4X 一 门 , 因而 得 到 一 个 信得过 的 X 的 误差 界 . 

自然 要 问 , 是 否 存在 某 种 类 似 的 方法 估计 4x 一 5b 的 计算 解 
的 精度 呢 ， 如 果 我 们 写 
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Bb—Ar—+, (65.1) 
那么 zx 揭 误差 是 4r。 因此 ， 如 果 我 们 按 某 种 范 数 有 i4- 的 
界 , 我 们 就 能 得 到 这 误差 的 界 。 可 是 ,即使 14- 的 界 十 分 精密 ， 
误差 的 界 仍 然 可 能 是 令 人 很 失望 的 ， 例 如 ， 假 定 4 是 规范 化 甜 阵 
使 得 147 一 105, 并 且 是 规范 化 的 右 端 ,使 得 1 493。 一 1， 
如 果 * 是 由 4-45 伟人 为 十 位 十 进 制 有 效 位 得 来 的 向 量 ， 那 么 我 
们 有 


lrle = ls 一 Axl < 二 nl0, (65.2) 


并 且 这 个 界 是 十 分 现实 的 ， 因 此 , 即便 我 们 真 的 给 出 这 样 一 个 >。 
以 及 对 于 4 -jw 的 一 个 正确 的 界 109, 我 们 也 只 能 证 实 * 的 误差 


的 模 以 去 010” 为 界 ， 这 是 最 令 人 失望 的 结果 。 为 了 能 够 判定 


这 样 的 解 的 精度 ， 我 们 需 楼 4 的 一 个 十 分 精确 的 近似 的 逆 X 以 及 
lx 一 4 的 适当 的 精确 的 界 。 


没有 小 主 元 素 的 病 杰 和 矩阵 

66. 人 们 可 能 认为 ， 如 果 一 个 规范 化 的 矩阵 4 是 干 分 病态 的 ， 
那么 在 用 主 元 素 的 三 角形 分 解 中 必定 会 通过 出 现 十 分 小 的 主 元 素 
来 反映 矩阵 本 身 的 病态 。 人 们 也 许 会 说 , 如 果 4 实际 上 是 奇异 的 ， 
并 且 分 解 是 准确 地 执行 的 ,那么 必定 有 一 个 主 元 素 是 零 ， 因 此 ,如 
果 4 是 病态 的 ,应 该 有 一 个 小 主 元 素 . 

可 惜 , 甚至 在 矩阵 4 是 对 称 的 悄 况 下 , 这 种 论断 都 是 不 对 的 。 
(这 个 情况 应 该 是 很 有 利 的 ,因为 所 有 的 都 是 1.) 考虑 有 特征 值 

1.00,0.95,0.90,.…,0.5 和 107* 
的 矩阵 ， 在 (4 一 10-*7) 是 准确 地 奇异 的 总 义 下 , 这 逢 阵 是 几乎 
冶 异 的 。 主 元 案 的 生 积 ? 等 于 特征 值 的 乘积 ,所 以 
Pf = 10-"(0.05)*201. 

如 果 所 有 的 主 元 素 相等 的 话 ,那么 每 一 个 都 接近 0.1， 我 们 肯定 不 
能 把 这 个 量 看 作 是 病态 地 小 ， 读 者 可 能 认为 ， 这 是 一 种 虚构 的 论 
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证 ， 但 是 在 第 五 章 356 我 们 将 看 到 这 种 例子 在 实际 上 会 发 生 。 这 
种 现象 不 仅 在 部 分 主 元 素 的 Gauss 消去 法 中 会 发 生 , 而 且 也 会 在 
Givens 三 角形 化 和 Householder 三 角形 化 中 遇 到 。 

在 用 部 分 主 元 素 Gauss 消去 法 解 方程 4x 一 2 (4,5 为 规范 
化 的 ) 的 过 程 中 有 许多 迹象 显示 出 方程 病态 的 特征 。 这 些 迹 象 是 : 

(让 “小” 主 元 素 ， 

(0“ 大 "的 计算 解 ， 

《让 )“ 大 "的 剩余 向 量 。 
可 惜 , 我 们 能 构造 的 十 分 病态 的 方程 组 它 并 不 发 生 上 述 的 任何 一 
种 现象 ， 用 + 位 运算 ， 我 们 可 以 得 到 元 素 是 数量 级 为 1 的 解 。 尽 
管 在 它 的 绝 大 多 数 有 效 位 都 不 正确 , 但 是 其 剩余 必定 是 2 了 阶 的 。 


近似 解 的 迭代 改进 


67. 上 一 节 的 研究 表明 ， 对 一 个 计算 解 的 误差 建立 可 靠 的 界 ， 
这 个 界 对 病态 方程 组 的 精密 的 解 来 说 ,也 不 是 悲观 的 ,这 决 不 是 一 
件 简 单 的 事情 。 现 在 我 们 来 说 明 怎样 改进 一 个 近似 解 ， 并 县 同时 
获得 有 关 原 来 的 解 和 改进 后 的 解 的 精度 的 可 靠 信息 , 
假定 我 们 已 得 到 4 近似 的 三 角形 因子 工 和 局 ,使 得 
LU=A+F, {67.1) 
我 们 可 以 通过 选民 过 程 用 这 些 三 角 办 于 得 到 一 系列 的 近似 解 x"?， 
它们 逼近 4x 一 5 的 真 解 *, 选 代 过 程 由 下 述 关 系 确定 。 
0 
于 BE 一 txt 一 xu dD 6 A 


(67.2) 


如 果 执 行 这 个 过 程 没有 命 人 误差 的 话 ,那么 我 们 就 有 
srt A+ Fb — Art-n) 
= x (A FT A(x 一 ze) 《67.3) 
这 给 出 
rx (A+ FA -一 xtt-o) 
一 [一 (4 二 FF)-L4]tz。 《67.4) 
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所 以 ,准确 的 选 代 过 程 收 敛 的 充分 条 件 是 


4+t FA < 1 (67.5) 
如 果 
HE < 二， (67.6) 
上 述 条 件 必定 能 满足 。 类 似 地 ,我 们 有 
ri 4 一 (4 十 Pd4jtr。 (67.7) 
如 果 (67.6) 满足 , 它 必定 趋向 于 零 。 


如 果 已 经 用 有 累加 的 浮 点 运算 和 部 分 主 元 素 Gauss 消去 法 把 
4 三 角形 化 了 ,一 般 我 们 有 


Fll。 < 2 一 . (67.8) 
因此 , 若 下 式 成 立 ,准确 的 迭代 过 程 收敛， 
4 和 le 一 27 (67.9) 


如 果 a2-| 4 < 2-*， 那么 每 一 次 选 代 至 少 有 ?位 二 进位 被 改 
进 ， 余 量 r* 至 少 缩 碱 27? 因子 。 如 果 22 4- 和 < 明显 地 大 于 


二 ,我们 就 能 期 望 过 程 收 全 


迭代 过 程 中 舍 人 误差 的 影响 


68. 事实 上 ,我 们 不 可 能 准确 地 执行 迭代 过 程 ， 并 且 乍 一 看 来 
合 人 误差 的 影响 似乎 是 灾难 性 的 。 如 果 迭 代用 某 种 位 运算 执 
行 ，xt 的 精度 不 能 贿 着 而 无 限 增长 ， 因 为 我 们 仅仅 用 * 位 表示 
这 个 分 量 . 

当然 ,这 是 不 出 所 料 的 。 但 是 ,我 们 转向 研究 利 余 的 时 候 发 现 
一 个 比较 混乱 的 情况 。 我 们 在 $63 已 指出 举例 来 说 ,假如 用 有 黑 
加 的 浮 点 运算 ， 那 么 对 应 第 一 个 解 的 镜 余 几乎 号 真 角 正 兢 地 命 人 
后 对 应 的 剩余 丰 回 样 的 最 级 。 记 以 我 们 几乎 不 能 期 多 每 次 奖 代 的 
剩余 减 缩 27? 因子 。 如 果 剥 余 大 至 上 保持 为 一 个 常数 、 似 乎 我 们 
不 可 能 使 得 每 次 迭代 的 解 稳定 地 改善 。 傣 而 真正 发 生 的 情况 是 ， 
只 要 在 计算 琵 余 时 用 了 内 积累 加 ,应 用 任何 一 种 类 型 的 运算 ,实际 
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的 执行 过 程 都 不 会 偏离 准确 的 选 代 太 远 。 

在 Wilkinson (1963,b), p. 121 ~ p.126 中 , 我 对 定点 运算 的 
选 代 过 程 作 了 详尽 的 误差 分 析 , 在 所 有 相关 的 阶段 都 用 了 累加 ,并 
且 每 一 个 x 和 dg 都 作为 块 浮 点 向 最 来 计算 的 。 这 里 我 们 不 
重复 这 个 分 析 , 但 是 因为 这 个 技术 在 以 后 各 章 中 是 极为 重要 的 , 因 
此 我 们 详细 来 级 述 它 。 如 果 用 浮 点 票 加 ， 显 然 效 作 一 些 相应 的 修 
政 , 此 时 这 个 过 程 的 确 是 稍为 简单 一 些 。 


定点 计算 的 选 代 过 程 


69. 我 们 急 定 4 的 元 素 用 单 精度 定点 数 给 出 ,并 且 用 内 积累 加 
有 交换 的 三 角形 分 解 计算 了 工 和 口 。 进 一 步 假 定 已 的 元 素 没 有 一 
个 模 大 于 工 的 。 右 映 上 的 元 素 也 是 定点 数 ， 但 是 可 以 是 单 精度 的 
或 双 精 度 的 。 

我 们 以 29y% 的 形式 表示 第 次 计算 的 解 x， 其 中 y* 是 
规范 化 块 浮 点 向 景 。 通 常 , 对 于 所 有 迭代 , Pi 是 常数 (至 少 如 果 4 
对 于 这 个 过 程 正常 执行 不 算 过 于 病态 时 是 这 样 ， 可 是 ， 如 时 在 最 
大 的 分 量 中 伟人 是 十 分 小 的 ,那么 从 一 次 迭代 到 下 一 次 迭代 pi 可 
能 有 土 1 的 变化 . ) 一 般 的 迭代 步骤 如 下 : 

(i) 计算 下 式 定义 的 准确 的 剩余 +*， 

rt B20RAY 
开始 得 到 的 这 个 向 量 是 非 规范 化 的 双 精 立 的 块 浮 点 向 量 。 显然 ， 
在 这 一 阶段 可 以 用 双 和 精度 的 向 量 ”而 不 需要 双 精 度 乘 法 . 

(ii) 把 剩余 向 量 r* 规范 化 ， 然 后 合 人 为 单 精度 的 块 浮 点 向 
量 , 记 为 2%4%。 

《种 ) 解 方程 LUx 一 ,得 到 的 是 块 浮 点 单 精度 向 时 形式 的 
解 ， 调 整 比例 因子 给 出 LUx 一 ?sk 的 计算 解 dt4。 

(iv) 从 关系 


iD Bf rt de 
计算 下 一 个 近似 解 ,得 到 的 是 一 个 单 精度 的 块 浮 点 向 量 xd 
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选 代 过 程 的 一 个 简单 例子 


70. 在 表 6 中 我 们 给 出 一 个 这 个 方程 应 用 于 一 个 3 阶 的 矩阵 
的 例子 ， 计 算是 用 有 内 积累 加 的 六 位 定点 十 进位 运算 执行 的 ， 抵 
阵 的 条 件数 在 10 和 10 之 间 . 


表 6 
有 三 个 不 同 右 端的 方程 组 迭代 解 
4 Bb Ea EN 


0.876543 0.617341 0.589973] [0.863257] [0.863257213! 0.4135762133 
0.612314 0.784461 0.B27742||0.82064? | |0.8206474986 4 [0.3712631241 
0.31732] 0.446779 0.476349 10-450098.」 [0.45009840143 [0.5163213142. 
工 v 

1-000000 0.876543 0.617341 0.589973 

0.698556 1.000000 | 0.353214 0.415613 

0.362014 0.632175 1.000000 上 上 0.000030. 

对 应 第 一 个 右 端的 选 代 
x EE ae ea 0 

.639129 0.6352B0 0.636330 0.636329 0.636329 

—0.050678 一 0.029140 一 0-029513 ~0.029507 一 人 -029507 

0.566667 0.548363 0.548680 0.548674 0.548674 


0% 0 0 047 人 
0.326160 。 0.172501 一 0.407893 0.304438 
0.204138 一 0.044726 一 0.450687 0.421313 
一 0.446030 一 0.032507 一 9.252623 0.242118 
对 应 第 二 个 右 端的 迭代 
re x x x we 
0.639129 0.636815 0.636855 0.636855 0.636855 
一 0.050678 —0.033187 —0.033490 一 0.033484 一 0.033483 
0.566667 0.551803 0.552060 0.952056 0.552056 
0 opn 0950) 10coyt 
0.539760 0.307503 0.677045 一 0.667109 


0.702738 0.147071 0.616500 —0.779298 
一 0.044630 0.076211 0,335715 —0.439563 


对 应 第 三 个 右 端 的 选 代 
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续 表 6 


x x x x te 
1632.2 1603.9 1604.4 1604,4 1604.4 
一 12536.6 一 12123.1 一 12126.8 —12126.8.—12126.8 
10484.6 10303.2 10306.4 10306.3 10306.3 
10 0 10roY 1 
一 0.218436 0.031220 一 0.389014 0.200959 
一 0.098483 一 0.113868 一 0.638125 0.189617 
-0.099289 -0.073525 一 0.372475 0.103871 


一- 一 

这 个 方程 组 对 三 个 不 同 的 右 端 求解 它们 说 明了 一 些 特殊 的 
有 意义 的 问题 . 

第 一 个 右 端 是 这 样 选 的 。 不 管 4 的 病态 ,其 真 解 是 1 的 量 级 ， 
因为 矩阵 对 于 过 程 的 成 功 执行 是 不 过 分 病态 的 ， 第 一 次 解 也 是 
的 量 级 ， 相 应 的 剩余 向 量 的 分 量 是 10” 量 级 , 尽管 解 的 第 二 位 十 
进位 有 误差 。 计 算 第 二 次 解 时 ， 第 一 次 解 的 不 准确 性 立刻 显示 出 
来 。 在 逐次 迭代 中 第 一 个 分 量 的 改变 重 是 一 0.002849，0.080050， 
一 0.000001，0.000000。 其 他 的 分 量 的 情况 类 似 ， 第 一 次 修正 产生 
的 大 的 相对 变化 表明 ,4 是 病态 的 ， 事 实 上 ,这 表明 其 条 件数 大 概 
是 10 量 级 ， 

在 这 个 例子 中 ,因为 U 的 最 后 一 个 元 素 是 0.000030, 轴 然 这 说 
明了 逆 的 (3.3) 元 素 是 30000 的 莉 级 。 我 们 不 可 能 构造 一 个 3 阶 
矩阵 在 这 种 情况 下 不 显示 出 病态 ,但 是 对 于 高 阶 和 矩阵 ,病态 不 一 定 
是 明显 的 ， 不 过 ,在 这 样 的 情况 下 ; 选 代 的 锤 态 仍然 给 出 了 可 靠 的 
指示 。 我 们 注意 所 有 剩余 向 量 的 大 小 是 十 分 一 致 和 的， 并 且 最 后 一 
个 剩余 对 应 于 真 解 舍 人 后 的 是 最 大 的 一 个 ， 

第 二 个 右 端 与 第 一 个 的 差别 仅仅 在 第 六 位 之 后 ， 因 此 第 一 次 
解 与 第 一 个 右 端 的 恒 等 。 但 是 , 在 生成 剩余 疝 量 时 ,我们 可 以 用 “ 
的 全 部 教 位 、 因 此 在 第 一 次 迭代 之 后 产生 额外 的 数位 。 虽 然 丙 个 
右 端的 差别 仅 有 10“ 量 级 ,但 由 于 上 4 下 | 是 10' 量 级 ， 所 以 两 个 
解 的 差 可 以 达到 10 了 量 级 。 这 证 明了 使 用 右 端 的 全 部 数位 是 极 
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其 时 要 的 . 

第 三 个 右 端 给 出 的 解 有 !0 量 级 的 分 有 最。 出 现 这 样 的 解 立刻 
反映 了 拭 阵 的 病态 、 并 且 我 们 不 会 有 误解 的 危险 。 因 为 得 到 的 解 
是 抉 浮 点 向 量 , 在 小 数 点 后 面 我 们 只 有 一 位 数字 .因此 ,即使 是 真 
和 解 ,正确 会 人 后 也 可 能 有 误差 土 0.05。 现 在 剩余 都 是 0.01 量 级 , 尽 
管 第 一 次 解 的 分 量 中 有 大 于 100 的 误差 。 这 个 量 级 的 随机 误差 会 
给 出 100 量 级 的 剩余 。 


选 代 过 程 的 总 评述 


71. 在 我 们 的 例 于 中 显示 出 的 特性 对 条 件数 是 10' 量 级 的 矩 
阵 是 典型 的 ,请 读者 十 分 认真 地 研究 官 ， 对 一 个 三 阶 的 拭 阵 ,人 们 
几乎 不 会 考虑 伟人 误差 的 “累积 影响 “， 重 要 的 是 要 认识 这 种 累积 
起 的 作用 -- 般 来 说 是 不 大 的 我 们 用 各 种 误差 的 粗略 的 鼻 来 说 明 


这 点 ,这 些 误差 来 自用 这 种 技术 解 右 端 是 规范 化 的 规范 化 方程 组 . 
在 这 些 界 中 已 包括 了 统计 的 效应 .我 们 假定 条 件数 是 2 量 级 , 真 


解 的 极 大 分 是 是 2 显 级 ,并 且 2 明显 地 比方 小 ， 


(a) 第 一 次 的 解 和 以 后 所 有 的 解 的 最 大 分 最 都 是 2 量 级 ， 

(b) 对 应 第 一 次 解 的 剩余 的 分 量 一 般 是 24)124~' 量 级 。 

(c) 第 一 次 解 的 分 量 的 误差 一 般 是 nf2"iat 量 级 ， 

《d) 对 应 第 二 次 解 (以 及 所 有 以 后 的 解 !) 的 剩余 分 量 一 般 是 
92 量 级. 

(e) 第 二 次 解 的 误差 一 般 是 z2*-”2* 量 级 。 

值得 注意 的 是 ,剩余 的 界 含有 因子 22， 因 此 在 所 有 阶段 , 它 与 
计算 的 解 的 大 小 成 正比 ， 而 与 条 件数 2" 无 关 。 可 是 我 们 知道 ，22 
水 能 大 于 2?， 因 此 扼 阵 的 条 件数 控制 辣 解 和 剩余 可 能 达 公 的 极 大 
值 . 

虽然 我 们 曾 说 过 程 是 “近代 ”的 ,我 们 一 般 希 望 用 很 少 次 迭代 . 
例如 ,假定 我 们 有 一 个 矩阵 5 一 25，4 一 ?2。 这 是 十 分 严重 的 病 
态 ， 尽 管 如 此 ,在 ACE 上 我 们 每 -- 阶 段 都 预计 能 获得 
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48 一 G92) 一 20 
个 二 进位 数字 ,因此 在 第 二 次 修正 之 后 ,答案 在 运算 精度 范 锣 内 究 


全 正确 ， 如 果 只 有 少量 的 右 端 ， 那 么 迭代 过 程 比 全 部 用 双 精 度 解 
要 经 济 得 多 ， 并 且 给 我 们 一 个 实际 的 保证 : 最 后 的 向 量 是 嘉 解 被 


合 人 后 的 最 ， 可 是 ,如果 22 4 中 > 了 那么 选 代 过 程 一 般 来 

说 根本 不 收敛 ,计算 的 解 中 没有 一 个 有 正确 的 数字 ， 如 果 
a2A < 1, 

用 双 精 度 运 算得 到 解 是 会 有 一 些 正确 数字 的 - 


有 关 的 迭代 法 


72, 我 们 刚刚 饮 述 的 方法 用 其 他 的 低 精 度 运算 方式 也 能 工作 ， 
只 是 在 计算 剩余 时 ,要 用 内 积累 加 。 如 时 没有 内 积累 加 设备 ,那么 
剩余 必须 用 双 精 度 计算 ， 在 其 他 的 阶段 ,内 积累 加 不 是 实质 性 的 。 
一 般 来 说 ,如 果 在 4 上 与 解 的 误差 对 应 的 等 价 摄 动 的 范 数 以 n*2™* 


为 界 那 么 过 程 能 执行 ,只 是 要 求 满足 "2 -4 引 小 于 革 . 实际 


上 ;由于 误差 的 统计 分 布 , 过 程 的 进行 通常 只 要 假定 a 久 27 了 4 
小 于 1. 《这 里 我 们 假定 主 元 素 的 增长 可 以 忽略 ,) 

类 似 地 ,如 时 我 们 用 了 Givens 或 Housshoider 三 角形 化 并 且 
存储 正 交 变换 的 信息 ,就 能 执行 类 似 的 迭代 。 在 这 种 情况 下 ， 内 
积累 加 也 仅仅 是 在 计算 剩余 这 个 阶段 是 重要 的 ， 对 于 三 角形 化 的 
焉 交 方 法 ,我 们 可 以 忽略 关于 主 元 素 增 长 的 条 件 , 因 为 在 这 种 方法 
中 问题 已 被 排除 了 。 不 过 ， 我 并 不 认为 正 交 变换 因此 就 是 适合 使 
用 了 . 


的 ， 事 实 上 ， 志 计 算 剖 全 中 庆生 内 训 基 与 丰 下 的 列 全 可-- 复 包 ( 让 
第 一 阶段 有 可 能 例外 ,这 时 由 于 有 因子 矿 , 对 于 高 阶 矩 阵 真正 剩余 
会 稍 大 一 些 .) 一 般 而 言 ， 逐 次 选 代 不 显示 出 下 全 的 趋势 ， 逐 次 得 
到 的 向 量 的 误差 与 第 一 次 解 的 误差 相当 ， 


选 代 过 程 的 极限 


73. 类 似 于 Wilkinson (1963,b), p. 121 ~ p.126 的 分 析 表 明 ， 

假若 没有 主 元 素 增长 的 现象 发 生 ,对 于 满足 形 如 
2 人 4 < 1 (73.1) 

的 某 种 准则 的 全 部 窍 阵 ， 迭 代 过 程 必定 收 伍 。 这 时 f(n) 与 三 角 
形 化 的 方法 和 运算 方式 有 关 。 如 果 过 程 不 收 剑 ， 并 且 在 三 角形 化 
时 没有 主 元 案 增 长 , 那么 我 们 能 绝对 肯定 4 不 满足 (73.1)， 我 们 
可 以 说 ,除非 用 更 高 的 精度 运算 ， 否 则 这 个 矩阵 “对 于 用 这 种 技术 
求解 来 说 是 过 份 病态 的 ”. 

可 是 ,这 里 剩 下 一 种 可 能 性 , 即 尽管 (73.1) 不 成 立 ,过 程 看 起 
来 收 和 敛 但 是 给 出 错误 的 结果 。 只 对 一 个 右 端 构造 这 样 的 例子 的 想 
法 就 立刻 显得 没有 把 援 ， 如 果 对 几 个 不 同 右 端 ， 我 们 会 被 这 种 假 
象 所 迷惑 似乎 是 不 可 想象 的 。 即使 是 $66 提 到 的 病态 矩阵 的 情 
况 , 它 没 有 一 个 主 元 素 是 小 的 , 解 是 1 的 量 级 ,第 一 次 剩余 是 2 一 量 
级 ,在 第 一 次 计算 修正 量 时 ,其 病态 就 立即 暴 话 无 踪 。 

在 任何 渤 代 法 的 自动 程序 中 ， 痢 能 够 容易 地 附加 一 些 安全 措 
施 ,n2” 量 级 的 主 元 素 或 者 27/ 量 级 的 解 都 是 一 种 可 靠 的 信号 ， 
它 表 明和 矩阵 的 条 件 使 得 选 代 收 名 ,万 一 发 生 相 反 的 情况 ,就 不 能 保 
证 获得 正确 的 解 ， 甚 至 接连 两 次 的 修正 量 不 减少 也 明白 无 误 地 表 
明 (73.1) 不 满足 。 


选 代 法 的 严格 的 调整 


74. 我 们 总 是 这 样 认为 ， 如 果 附 加 了 上 面 提 到 的 安全 措施 (不 
这 样 做 也 可 能 ), 用 它 的 当前 值 迭代 是 安全 地 收 敏 的， 作 进 一 步 的 
证 明 是 画 蛇 其 足 . 

可 是 如 果 我 们 不 准备 作出 证 明 , 我 们 必须 得 到 14 -站 的 上 界 。 
有 时 这 样 的 界 可 能 从 理论 的 研究 中 得 到 一 个 先 验 的 估计， 另 一 方 
面 ,我 们 可 以 用 三 角形 撼 阵 得 到 计算 的 逆 X, 然 后 像 864 那样 计算 
LAX 一 了 来 得 到 14 是 的 界 ， 如 果 14 的 界 保证 了 (73.1) 
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成 立 ， 那 么 我 们 知道 逃 代 过 程 必定 收 僵 ， 并 且 给 出 正确 的 解 。 否 
出, 我 们 判定 4 对 于 计算 精度 来 说 是 过 份 病态 的 。 

信 得 注意 的 是 。 计 算 了 X 之 后 我 们 可 以 用 另 一 种 迁 代 过 程 从 
Xro 而 不 是 解 方程 LUx 一 0 来 计算 修正 量 4 在 Wilkimson 
(1963，b)，p.128 ~p.131 中 ,我 们 分 析 了 这 个 过 程 并 的 出 它 不 如 
$67 的 方法 那样 令 人 满意 。 这 两 种 选 代 涉及 的 冬 法 量 大 致 相同 。 
我 们 看 到 ,只 是 为 了 得 到 4- 中 的 上 界 , 就 要 付 由 高昂 的 代价 。 

75. 有 一 个 比较 经 济 的 计算 | 4- 外 上 界 的 方法 ,虽然 它 可 能 
是 十 分 悲观 的 ， 记 

LL=D+i, 也 一 站 十 局 {75.1) 
其 中 D, 和 D; 是 对 角 型 的 , ,和 U, 分别 是 严格 的 下 三 第 型 和 上 
三 角 型 . 于 是 车 :是 


(24 oIED(UD|— lVDx—e (75.2) 
的 解 ,其 中 。 是 分 量 为 1 的 疝 量 ,那么 ， 
zis 宏 14- 下 (75.3) 


从 $62 我 们 知道 ,(25.2) 的 计算 解 的 分 量 的 相对 误差 小 , 因此 给 我 
们 一 个 14- 的 可 靠 的 界 。 
至 注 

本 章 涉 及 的 仅仅 是 本 书 直接 有 关 的 线性 方程 组 的 某 些 方面 ， 
我 们 没有 引 用途 代 法 的 文献 。 要 了 解 更 一 般 性 的 研究 ， 读 者 可 参 
阅 Fox (1964) 和 Householder (1964) 关于 直接 法 和 迭代 法 的 
节 及 Forsythe 和 Wasow {1960) 和 Varga (1962) 关于 迭代 法 
的 著作 ， 

平衡 问题 在 Forsythe 和 Straus (1955) 的 文章 中 已 经 研究 
过 ,更 新 的 有 Bauer 《1963) 的 论文 。 这 些 论文 给 出 许多 深入 了 
解 有 关 因 案 的 好 恩 想 ， 但 是 在 实 中 中 计算 逆 之 前 怎样 去 实现 平 稀 
仍然 是 难以 对 付 的 。 平衡 问题 经 常 与 Gauss 消去 法 的 主 元 素 第 
赂 联系 在 一 起 讨论 ， 并 且 可 能 给 我 们 一 个 印象 ， 用 正 交 三 角形 化 
时 与 它 无 关 。 这 并 不 是 如 此 的 ， 如 果 我 们 考虑 如 下 矩阵 就 会 明白 
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这 ” "点 , 撼 阵 元 素 的 最 级 为 


1 108 10" 
1 1 1 |. 
1 1 I 


在 正 交 三 角形 化 之 前 ,第 一 行 应 该 引信 比 全 因子 ,否则 其 他 行 要 但 
受 损失 . 

第 一 次 发 表 的 以 Gauss 消去 法 为 基础 的 误差 分 析 是 Von 
Neuman 和 Goldstine (1947) 和 Turing〔1948)。 前 者 的 论文 对 
于 正定 矩阵 的 逆 的 严格 的 论述 可 以 说 是 匡 定 了 现代 误差 分 析 的 基 
础 ， 本 章 给 出 的 分 析 是 基于 作者 在 1957 和 1963 之 间 的 工作 ， 并 
且 都 用 向 后 误差 分 析 ， 有 点 类 似 的 分 析 方法 在 Gastinel 《1960) 的 
论文 中 也 给 出 过 。 


第 五 章 Hermite 矩 阵 


引言 


1 本章 叙 述 求解 Hermite 逢 阵 特征 值 问题 的 方法 。 我 们 假 
定 逢 阵 不 是 多 醇 的 ， 也 没有 其 他 方面 的 特点 。 适 用 于 笑 芝 拭 阵 的 
方法 在 以 后 各 章 讨论 . 

在 第 一 二, 三 章 中 我 们 已 经 看 到 ，Hermite 逢 阵 的 特征 信和 问 
恶 通常 比 一 般 和 矩阵 的 简单 Hermite 知 陈 4 的 初等 因子 总 是 线性 
的 ， 并 且 必定 存在 南 矩 阵 丸 使 得 

RH4R 一 diag(11). C11) 
此 外 ,特征 信 部 是 实 的 ,并 且 在 第 二 章 831 中 我 们 已 经 证 明了 : 抑 
阵 4 有 微小 摄 动 ,特征 值 产生 的 摄 动 必定 也 是 微小 的 .如 果 摄 动 秆 
阵 是 Hermite 的 ,那么 特征 值 依然 是 实 的 《第 二 章 538)。 虽然 特 
征 向 量 不 一 定 是 “好 定 " 的 ， 但 “ 劣 定 "的 必然 是 对 应 很 靠近 的 特征 
信 的 ,因为 第 二 章 (10.2) 中 的 5 一 1. 

2. 本 章 的 大 部 分 章节 中 ， 我 们 只 考虑 实 对 称 和 矩阵 ， 对 于 这 类 
甜 降 ，(11) 的 矩阵 丸 能 够 取 为 实 的 因而 它 是 一 个 正 交 上 矩 阵 。 应 
该 记 住 , 复 的 对 称 矩 阵 不 具有 实 对 称 矩 阵 的 任何 重要 性 质 (第 一 章 
§24), 

对 于 一 般 形 式 的 和 矩阵 4， 特 征 值 问题 的 大 多 数 解法 都 是 利用 
一 个 相似 变 换 序列 转化 4 为 特殊 形状 的 矩阵 。 对 于 Hermite 矩 
阵 、 我 们 推荐 用 症 矩 阵 , 因为 Hermite 性 质 以 及 所 有 随 之 而 来 的 
优点 都 被 保持 。 本 章 叙 述 的 方法 采用 第 一 章 43~546 引进 的 初等 
本 变换 . 


实 对 称 和 矩阵 的 经 典 Jacobi 方法 
3. 在 Jacobi 方法 中 (1846) ,一 系列 平面 旋转 把 原 矩 阵 变换 为 


ss 


对 角 型 。 严 客 地 说 ,产生 对 角 型 所 需要 的 平面 旋转 数 由 是 无 穷 的 . 
这 是 预料 得 到 的 ， 因 为 通常 我 们 不 能 在 有 限 步 求解 一 个 多 项 式 方 
程 ， 在 实际 计算 中 ,一 旦 非 对 角 元 素 在 运算 精度 内 小 到 可 以 忽略 ， 
计算 过 程 就 停止 ， 对 于 实 对 称 和 矩阵 ,我 们 用 实 平面 旋转 

我 们 用 4。 表示 原 矩 阵 ，Jacobi 方法 可 描述 如 下 。 产 生 和 矩阵 
序列 44, 它 满足 关系 


Ai = RidinRil, {3.1) 
其 中 和 矩阵 R4 由 下 述 规则 确定 . (注意 , 我 们 采用 记号 R41,RE 
而 不 用 Ri44k-,RA， 以 便 与 第 三 章 的 一 般 性 分 析 一 致 ,) 
假定 44 的 极 大 模 非 对 角 元 素 在 位 置 (p,g) 上 ,那么 Ri 对 
应 在 平面 (p, 4) 上 的 一 个 旋转 , 转角 9 的 选取 法 是 使 得 4 的 
(p,q9) 元 素 被 化 为 零 ， 我 们 得 到 
Rep = Rae = cosB, Rpa™— — Res sind, 
Ri 1 (jp,9); Ri 一 0, 其他， 32) 
这 里 我 们 假定 ?了 小 于 9。4i 与 A441 的 差别 只 是 第 P, 9 行 和 第 p， 
49 列 不 同 ， 且 所 有 的 4 都 是 对 称 的 . 修改 后 的 值 由 下 列 式 子 确 
定 ; 
a 0s 十 oosing 一 ay， 
2 一 一 a 和 sin0 十 aDco0s6 一 a 多 
a 各 一 a 和 -0cos0 十 22 的 0cosgsng 十 aosiob， 
2 昌 一 a 化 Vig 一 2 入 Dcos0 sin0 十 ok-9cov6， 


4 光一 (a 和 DD 一 a 入 -9) cos9 sin0 十 a 忽 (co80 一 sin'9) 一 a 外. 


i p49, (3.3) 


(3.4) 
因为 < 站 应 当 为 零 , 我 们 得 到 
tan28 = 24W 23/(eW? 一 a 和 %?), (3.5) 
我 们 总 姑 取 9 在 下 玉江 图 
1681 < 十 , (3.6) 


如 果 喝 * 一。 吕 3, 取 9 为 十 上 =, 符号 与 (的 ?的 一 臻 我们 从 
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定 ?由 ? 关 0， 否 则 对 角形 化 已 经 完成 了 。 这 个 过 程 实质 上 是 迭 
代 的 ,因为 用 一 个 旋转 把 一 个 元 素 化 为 零 之 后 , 授 凌 的 另 一 些 旋转 
通常 又 会 使 它 变 为 非 零 。 


收效 率 


4 现在 我 们 证 明 : 如 果 每 个 角 8 都 按 (3.6) 规定 的 范围 内 到 
值 ,那么 当 丰 一 oo 时 


4k 一 diag(1;), (4.1) 
其 中 如 是 4 的 特征 值 。 因 此 ,对 某 种 顺序 来 说 也 是 所 有 4 的 特 
征 值 . 
我 们 写 
A — diaglaf?) 十 El, {4.2) 
其 中 E 是 非 对 角 线 元 素 构成 的 对 称 矩 阵 .我 们 首先 证 明 当 一 
oo 时 ， 
llEills 一 0.。 (4.3) 
事实 上 ,从 等 式 (3.3) 我 们 得 到 


BE Ly + Gy] ~ DLP) + (ef). 
EE 


{4.4) 
因此 , 非 对 角 线 元 素 [不 包括 (p,q),〔q,) 元 素 ] 的 平方 和 是 一 个 
常数 。 然 而 这 两 个 元 来 已 变 为 零 ,因此 
Er = ER 恰 一 2Ca 和 29》 (4.5) 
又 因 “个 ”是 Es 的 极 大 模 元 素 , 因 此 
las 12/ ~ El < [1 — 2/(m — 1)]Eol, 
(4.6) 


不 等 式 (4.6) 给 出 收敛 率 的 一 个 粗略 的 界 。 记 
Nn —n), (4.7) 
于 是 
NEw 时 C1 一 /NYNIE < El (4.8) 
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我 们 将 看 到 这 给 出 一 个 收敛 率 的 过 低 的 估计 。 可 是 它 的 确 表明 ， 
当 r>2ln(1/e) 时 ， 


Evlli < sllEolls. (4.9) 
例如 ， 对 8 一 2， 这 给 出 
r > 2la2xx1.391。 (4.10) 


收效 于 头 定 的 对 角 和 矩阵 


&. 我 们 还 必须 去 证 明 44 趋向 于 一 个 国定 的 对 角 逢 隆 。 假定 
挝 代 继续 到 


Erlls < es {5.1) 
于 是 从 (4.2) 我 们 君 出 , 如果 4 的 特征 值 4i( 也 就 是 如 的 特征 值 》 
和 a 失 都 按照 递增 顺序 编号 , 那么 这 两 个 序列 中 ,对 应 的 特征 值 的 
ya & 《第 二 章 $44)。 因 此 ， 接 照 某 种 顺序 a 从 落 在 以 2 为 中 
心 的 宽度 为 28 的 区 闻 内 。 因 为 s 可 以 任意 小 ,所 以 我 们 能 把 特征 
值 确定 到 任何 需要 的 精度 。 
现在 我 们 证 明 每 一 个 a 招 必定 收敛 于 确定 的 4h。 首先 我 们 
假定 4 是 相 异 的 ,并 且 定 义 。 满足 如 下 关系 。 
0< 4 ~ mal — |, (5.2) 


设 克 选 得 使 (5.1) 满 足 ,从 (4.6) 可 知 , 它 被 以 后 的 所 有 EE 满足， 显 
然 ,对 这 样 定义 的 s, 以 4 为 中 心 的 区 间 是 不 相交 的 , 并且 正好 一 
个 a 郑 滥 在 一 个 区 闻 内 ， 我 们 可 以 假定 ,已 把 % 编号 使 得 每 个 
< 次 洲 在 罗 区 间 . 我 们 证 明 , 在 以 后 的 任何 阶段 ,它们 仍然 保持 在 
不 来 的 区 间 内 ， 
假定 下 次 选 代 是 在 平面 (P,， 9) 上 , 那么 对 角 线 元 素 仅 有 《P。 
P),(9,9) 发 生 改 变 。 因 此 ，a 吕 9, 只 2 必定 仍然 是 在 ts 和 ja 
区 间 内 的 渍 个 对 角 线 元 素 ， 我 们 证 明 ， 落 在 lz 区 闻 内 的 必定 是 
80 事实 上 ， 
一 pm 4 多 sin2g 一 26 小 cosgsin6 + 4cos'd — tp 
一 《9 饥 一 1p)sin28 十 (as 外 一 17 十 44 一 4p)cos'9 
一 2aicosbgsinp， (5.3) 
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汝 而 
je 车 2 一 2p| > 和 一 1p1leo50 一 |a 风 一 21sin’0 


一 la 只 一 2alcosi 机 1 名 | 
> 48cosb 一 ssin?8 一 scos — BE 
一 25cos20。 {5.4) 


可 是 ,我 们 有 
iran29| 一 24 多 /(a 兴 一 a9) 2e12e 一 1。 (55) 


对 于 (3.6) 规定 的 范围 内 的 6, 我 们 有 1291 < 二 ,因此 


NatD 一 451 > 2te. (5.6) 
这 就 证 明了 a 潜 * 不 落 在 a 区 间 内 . 
6G. 引信 重 特 征 值 不 会 产生 很 多 困难 ,现在 我 们 定义 5 使 得 对 
所 有 不 同 的 1 和 为, (5.2) 成 立 。 我 们 知道 , 如 果 和 是 5 重 零 点 ， 
那么 恰巧 * 个 * 钨 获 在 履 区 间 内 【第 二 章 $17)， 洲 在 不 同 4 区 
间 的 a 多 和 4 加 不 能 互相 掉 换 所 属 区 间 的 证 明 仍 成 立 ， 因 此 , 在 
某 一 时 刻 以 后 , 随 著 《地 加 A 的 每 个 对 角 元 素 必定 保持 在 辐 
的 4 区间 之 内 ,并 且 当 万 ~> oo 时 ,区 间 的 宽度 趋向 于 零 。 


请 


顺序 Jacobi 方法 


7. 在 自动 计算 机 上 寻找 最 大 非 对 角 线 元 素 是 耗费 时间 的 ，、 通 
常 我 们 按 某 种 简单 的 方法 选取 消去 对 象 ， 也 许 最 简单 的 方式 是 按 
闫 序 ,2), (1，3)。 ,C1, 2);(2, 3), C2, 4), (2, 2); es 
(一 4), 然后 再 转 同 (1,2) 元 察 ,有 了 时 我 们 称 这 种 方式 为 特殊 沽 
序 Jacobi 方法 ,以 区 别 于 这 种 方法 的 其 他 推广 ， 即 按 任 何 一 种 顺 
序 用 N 个 旋转 使 所 有 非 对 角 线 元 素 都 被 消去 过 一 次 。 在 这 种 贿 序 
方法 (特殊 或 一 般 ) 中 ， 我 们 把 这 样 的 N 个 旋转 的 序列 称 为 一 次 扫 
描 ， 

”Forsythe 和 Henric (1960) 证 明 ， 如 果 对 转角 加 以 适当 限 
制 ,特殊 顺序 Jacobi 方法 收 化 ， 但 证 朋 方 法 十 分 复杂 。 在 315 我 
们 描述 一 个 不 同 的 顺序 方法 ,其 收敛 性 是 有 保证 的 ， 


wae 


Gerschgorin 
8. 假定 4 的 特征 信 4 各 不 相同 ,比如 说 ， 


min] 4s — | = 26, {8.1) 
并 且 我 们 有 人 矩阵 4x 使 得 
1 各 一 直 < 二 8，maxlaol 一。， (8.2) 
其 中 
(一 了 e < 二 2. (8.3) 
这 时 Gerschgorin 加 是 志 不 相交 的 ,因为 
1 一 唤 [ > 全 一 双 一 你 一 本 一 | 区 一 可 > 汉人 
(8.4) 
因此 ,我 们 有 
1 多 一 < 一 Ds， (8.5) 


现在 假 车 我 们 用 s/6 乘 第 ; 行 , 用 9/s 乘 第 i 列 ， 那 么 第 i 个 
Gerschgorin 贺 必 然 被 包含 在 下 面 的 加 内: 


la —X| < (s ~— 1)e/s. (8.6) 
而 其 它 的 图 包含 在 下 面 的 一 些 国内; 
lp < 一 ?8 十 3 (Gr. (8.7) 


第 i 个 圆 必然 孤立 出 来 , 因此 从 (8.6) 我 们 看 出 , 当 非 对 角 线 元 素 
的 绝对 信 已 经 变 得 小 于 6 时 ,对 于 充分 小 的 s， 对 角 线 元 素 与 特征 
值 的 差 是 a 数 最 级 ， 值 得 注意 的 是 ， 如 果 扫 有 一 些 重 特征 值 , 我 
们 对 任何 单 特征 值 仍然 能 够 得 到 同样 的 结果 . 


Jacobi 方法 的 最 后 的 二 次 收效 性 


9. 我 们 已 经 说 明 , 当 非 对 角 线 元 素 变 得 很 小 的 时 候 ,我 们 能 够 
得 到 十 分 好 的 特征 值 的 估计 。 因此 ， 人 和 任何 一 种 Jacebi 方法 的 收 
全 性 在 后 面 的 阶段 变 得 更 决 是 重要 的 ， 对 于 特征 信 各 不 相 褒 的 情 
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现 。 已 经 证 明了 有 凡 种 Jacobi 方法 确实 最 后 都 变 成 二 次 收 剑 的 . 
第 一 个 结果 是 Henrii《1958a) 取得 的 .现在 我 们 用 4 和 38 的 
记号 描述 到 目前 为 止 最 好 的 一 些 结果 。 

在》 对 于 经 典 的 Jacohi 方法 ，Sch6npage (1961) 已 经 证 骨 ; 
如 果 


1 一 128 (Gz) (9.1) 
并 且 我 们 已 经 达到 
lals < Fe (9.2) 
的 阶段 ,那么 
1 pn, l/s 093 
E+wlls < 人 条 ) lls 3. .3) 


Schinhage 又 进一步 证 明 如 下 结论 : ”如 果 除 了 ? 对 重 特征 值 外 
《9.1) 成 立 , 那么 


Eve < 二 lB/8， (9.4) 


其 中 
rN pn 2). (9.5) 
(6i) 对 于 一 般 显 序 Jacobi 方法 ，Wilkinson (1962c) 已 经 证 
明 : 在 (9.1) 和 (9.2) 条 件 下 ， 


Benlle < 二 na 一 11M/6. (9.6) 


Schinhage 已 经 指出 ,即使 4 有 一 些 重 特征 值 对 ,只 要 对 应 于 这 些 
对 的 旋转 首先 实行 ,上 述 结果 也 成 立 ， 

(证) 关于 特殊 颗 序 Jacobi 方法 ，Wilkinson (1962c) 已 经 证 
明 : 

IErralls < EMC2¥8). (9.7) 

我 们 要 指出 ,上 述 这 些 结果 的 证 明 只 是 说 明 当 过 程 收敛 时 ,它们 最 
后 是 二 次 收敛 的 . 但是 从 未 证 明 一 般 循环 Jacobi 方法 是 收复 竟 
(mR $15), 
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汰 近 的 和 量 的 特征 什 


了 .收敛 率 的 界 均 包含 因子 1/8, 这 似乎 意味 车, 如 果 # 小 ,二 
次 收 化 性 的 开始 时 刻 要 被 推迟 .如 果 # 是 零 ,前 一 书 结果 的 证 明 就 
失败 虽然, 对 于 特征 信 慎 数 不 大 于 二 的 矩阵 ,我 们 稍稍 修改 消 元 
的 顺序 便 能 保证 二 次 收敛 性 (例如 见 Schtnhage 《1961))。 关于 特 
征 值 音 数 大 于 二 的 情况 ,收效 率 的 研究 没有 什么 进 形 。 
实际 上 ,我 们 用 特殊 顺序 Jacobi 方法 的 经 验 表 明 ， 十 分 舍 近 
的 和 重 的 特征 信 通 常 影响 送 代 次 数 ， 它 使 得 压缩 非 对 角 线 元 素 达 
到 搞定 水 平 以 下 需要 的 迭代 次 数 小 于 我 们 想像 的 . 对 阶 教 高 至 50 
的 答 阵 ,其 元 案 32 到 48 个 二 进位 的 字 长 , 扫 措 次 数 平均 需要 3 
至 6 次 ， 有 重 特征 值 的 矩阵 所 需要 的 送 代 次 数 经 常 是 稍 小 于 这 平 
均 忆 ,下面 我 们 指出 为 什么 会 发 生 这 种 现象。 
首先 如 果 全 部 特征 值 等 于 4., 即 矩 降 是 4.1, 自然 它 不 须要 选 
代 ! 再 考 卡 不 是 这 祥 极 端的 情况 ， 候 定 所 有 的 特征 值 都 很 能 近 , 比 
如 说 ， 
二 (10.1) 
其 中 上 与 6 比 是 小 玲 。 那 么 对 某 正 交 和 矩阵 上 ,我 们 有 
A RT dag (a + 5)R, (10.2) 
因此 ， 
A= al + Ridiag(6)R, (10.3) 
现在 ,我 们 有 
NRdiag(8) Rlle = (ZE8)t, (10.4) 
这 表明 初始 的 非 对 角 线 元 素 必 定 是 小 的 。 对 4 作 的 计算 与 对 (4 
一 af) 作 的 计算 是 一 致 的 ,而 且 这 箱 阵 在 原来 的 意义 下 不 再 是 特 
殊 的 . 可是, 因为 (4 一 a1) 的 所 有 元 素 都 小 ,我 们 可 以 期 望 讨 
缩 非 对 角 线 元 案 到 规定 水 平 以 下 ， 对 4 所 需要 的 次 数 比 对 一 般 的 
对 称 抢 阵 的 要 少 。 事 实 上 ， 如 果 max|5i1 一 D(10)， 那么 可 以 
期 记 通 常 压 继 4 的 非 对 角 线 元 素 到 10” 以 下 , 需要 的 次 数 可 以 压 
缩 它 们 到 10-…… 以 下 。 
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例如 ,对 于 下 面 定义 的 对 称 托 阵 妞 
0.2512 0.0014 0.0017 
0.2511 0.0026 
0.2507 
(这 里 仅 给 出 上 三 角形 部 分 )， 显 然 转角 与 下 面 定义 的 矩阵 C 的 相 
0.1200 0.1400 0.1700 
0.1100 0.2600 
0.0700 
同 ， 可 是 ,如 果 想 用 矩阵 C， 我 们 必需 记 住 ,为 了 给 出 的 韭 对 锡 
线 元 素 是 107' 数量 级 ,只 须 压缩 C 的 非 对 角 线 元 素 到 10 了 以 下 . 
现在 我 们 证 明 , 如 果 和 矩阵 4 有 ( 一 1) 重 特征 值 a, 那么 用 不 
着 一 次 扫描 它 就 化 为 对 角 型 。 我 们 用 5 表示 另 一 个 特征 信 ，4 可 

以 表示 成 


B= {10.5) 


C == 100B 一 257 。 (10.6) 


A RT 


{10.7) 
旺 隆 a7 不 影响 Jacobi 过 程 ,而 (10.7) 右 边 的 第 二 个 矩阵 的 (i, 让 
元 索 是 (4 一 a)rwrsi。 由 此 我 们 可 以 立刻 得 出 结论 ， 消 去 4 的 
第 一 行 元 素 所 需要 的 (n 一 1) 个 旋转 ,事实 上 也 消去 了 所 有 非 对 角 
元 素 ， 

数值 例子 


11. 表 1 和 表 2 都 用 来 说 明 过 程 本 身 和 最 后 阶段 的 二 次 收 化 
性 ， 注 意 除 了 位 于 有 关 行 列 交叉 点 的 四 个 元 素 并 且 其 中 有 两 个 变 
为 零 之 外 ,我 们 不 需要 作 行 , 列 变换 ， 我 们 仅 存储 和 计算 上 三 角 部 
分 的 元 素 并 假定 下 三 角 部 分 的 对 应 元 类 与 他 们 入 等 ， 这 样 做 保持 
短 阵 的 对 称 性 。 因 此 ,完成 一 次 扫 找 约 希 2m 个 乘法 ,每 一 次 旋转 
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约 有 4 个 乘法 。 一 个 六 阶 手 阵 经 过 在 平面 (3,5) 上 的 旋转 ,被 修 
履 的 元 素 由 下 式 标明 ， 
x Xx x x x x 
x x x x 
Xe 
: (11.1) 
x x x 
Xx 
x 
表 1 中 我 们 选择 的 例子 是 ， 第 一 次 旋转 之 后 所 有 非 对 角 线 元 素 与 
对 角 线 元 素 之 间 的 相 比 都 是 小 量 ， 以 后 的 旋转 是 小 转角 的 ， 不 是 
在 压缩 为 零 的 元 素 改变 量 很 小 ， 以 至 于 四 位 十 进位 小 数 的 运算 精 
度 之 内 它们 保持 不 变 ， 

表 2 中 我 们 选择 的 例子 是 用 来 说 明 ， 出现 一 对 靠近 的 对 角 线 
元 素 并 不 推迟 二 次 收 倒 性 的 到 来 。 我 们 已 取 前 两 个 对 角 线 元 素 相 
等 .而 所 有 非 对 角 线 元 素 都 小 。 第 一个 旋转 (在 (L2) 平 面 ) 转 角 是 
二 =。 它 压 编 《1,2) 元 素 为 零 ， 其 他 非 对 角 线 元 素 保持 数量 级 不 
变 。 第 二 个 旋转 角 ( 在 (1,3) 平 面 ) 是 小 的 ,因为 第 一 个 和 第 三 个 元 
素 并 不 靠近 。 这 间 样 适用 于 (2,3) 旋 转 ,在 这 次 扫描 的 终点 所 有 非 
对 角 线 元 素 对 在 运算 精度 之 内 部 是 零 ， 

显然 ,如 果 有 若干 对 对 角 线 元 素 淡 近 (或 重合 ), 以 上 的 论证 同 
祥 适 用 。 但 是 ， 对 三 个 或 三 个 以 上 对 第 线 元 素 按 近 的 情况 是 不 适 
用 的 。 


cos@ 和 sin@ 的 计算 


12. 到 理 前 为 正 ,转角 的 计算 已 看 成 不 成 问题 的 . 但 必须 注意 
第 三 章 $20 的 分 析 并 没有 包括 它 ， 实 际 上 ,如 果 要 做 到 下 述 两 点 ， 
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表 1 


0.6532 0.2165 0.0031] 在 (132) 平 面 的 旋转 
人 -| 0.4305 2 tan28 一 2X0,21657(0,6532 一 0.4105) 
0.2132| cosg 一 0,8628，sin 日 一 0.5055 
0.7800 0.0000 0.0000] 在 (1;3) 平 面 的 放 转 
A -| 0.2836 oo tan20 一 2X0.0053/C0.7800 一 0.2123) 
0.2132] cosg = 1.0000, sing = 0.0094 


注意 因为 si9 小 ,9 就 小 ， 
0.7801 0.0000 0.0000] 在 (2,3) 平 厕 的 把 转 
4 -| 0.2836 oo tan28 一 2X0.00291(0,2836 — 0.2132) 
0.2132 easg 一 0.9991，sing 一 0.9411 
元 未 (132) 在 运算 精度 之 内 保持 为 鹤 。 元 家 (2>37 保 持 为 小 量 ， 事 实 上 它 在 运算 精度 内 


不 变 . 
0.7081 0.0000 0.0000 
“| 0.2837 oo] 
0.213L. 
在 运算 精度 内 和 矩阵 已 对 第 形 化 , 


表 2 
1 0.0012 | 在 (152) 平 面 的 旋转 
一 


0.2500 0.0037| tan20 ~ 2X0.0012/(0.2500 一 0.25007 
0.6123」 cnsg = sin 一 0.7071 
0.2512 0.0000 0.0036] 在 (1,3) 平 面 的 旋转 
入 -| 0.2488 | tan28 = 2X0.0036/(0,2512 — 0.6123) 
0.6123」 cosg = 1.0000。uing 一 一 0-0099 
接着 的 两 个 族 转 者 是 小 转角 的 117 和 (2y2) 元 素 接近 但 不 起 重要 作用 , 
0.2512 0.0000 0.0000] 在 平面 (2,3) 的 施 转 
A -| 0.2488 oa tan26 ze 2X0.0016/C0.2488 一 0.6124) 
0.6124] cos8 一 1.0000。sing 一 —0,0044 
0.2512 0.0000 0.0000 
“| 0.2488 | 


0.6124 


对 它 必须 十 分 重视 ， 

(iD cos9 十 sin6 十 分 接近 数字 。 因此 ， 变 换 和 矩阵 几乎 是 正 
交 的 ,而 且 变换 后 的 矩阵 几乎 相似 于 原 矩 降 ， 

(说 (a 入 一 a 次 }cos6 sin9 十 a 党 (cos6 一 sinBp) 很 小 , 我 们 
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有 理由 用 零 代替 a 内?。 


我 们 略 去 上 标 太 并 写 
tan28 一 24po/(app 一 da) = x /ys (12.1) 
其 中 
Tm +2apgs 了 一 leper — 2g4l. (12.2) 


对 于 沙 在 范围 19| < 二 = 的 9, 我们 在 形式 上 有 


2cosg = [Cr +t PE y(t 
2sin:0 = [C(x + PE y+ 
其 中 我 们 令 cos6 取 正 值 , 令 sin9 取 与 uan26 相同 的 符号 ， 
现在 如 果 x* 比 y 小 ,等 式 (12.3) 确定 的 sin8 是 最 不 合适 的 . 
对 所 有 满足 lz| 过 107y| 的 xy 用 十 位 十 进 制 定点 或 浮 点 计算 ， 
方程 (12.3) 都 是 给 出 sin6 一 0 和 ecos8 一 !1， 因 此 ,虽然 条 件 ( 
得 到 保证 ,但 条 件 (i 不 满足 。 
另 一 方面 ,如 果 用 评点 运算 ,(12.3) 决定 的 cos6 是 十 分 令 人 
满意 的 ， 事 实 上 ,从 第 三 章 ,86, $10 我们 有 
uf +ty)= + (+ 6) (el < 天 (2.00002)2-0)， 
v= fl(a¥) = wt(1 + 62) (ls < (1.00001)27) ， 
w= filly+t y= +s) (sl <2), 
sfl(w/2) = wll+ er)/2v (lal < 27°), 
c= filst) = zi(1+ 6,) (ls, < C1.00001)2"). 


综合 上 述 结果 ,我 们 必然 有 
c= cosb(1 十 8) (le < (3.0003)2"), (12.5) 
其 中 cos6 是 对 应 于 x 和 Y 的 真 值 ， 此 后 我 们 给 出 的 界 都 是 很 
宽 的 ， 用 详细 的 分 析 常 常 可 以 改善 它们 。 从 关系 
2singcos6 一 xj/(z2 十 万) (12.6) 
我 们 可 得 到 sin6 的 值 :， 应 用 浮 点 运算 各 计算 值 ,我 们 得 到 
sfl(x/2cv) = x(l1 + 6@)/2cv (Jer{ < (2.00002)27), 
{12.7) 


(12.3) 


{12.4) 


由 此 式 及 (12.4),(12.5) 式 我 们 可 归纳 为 
:= sinOg(l + 60) (les| < (56.0006)27"). {12.8) 
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多 此 ， 与 对 应 给 定 的 x*, 》 的 准确 值 相 比 ，s 和 “ 的 祸 对 误差 都 
小 。 很 明明 ,现在 计算 值 也 满足 条 件 (). 
13. 如 果 能 做 内 积累 加 ，、 在 定点 计算 中 要 得 到 比较 好 的 结果 、 
下 述 方法 是 很 适当 的 。 我 们 准确 地 计算 2 十 六 ,然后 选取 《为 满 
足 不 等 式 
PP+ EL {13.1) 
的 最 大 的 整数 .在 等 式 (12.3) 中 用 2 tx 和 247 分 别 代替 +, y 计算 
cosg, 再 用 等 式 (12.6) 计 算 sin6。 
另 一 种 情况 是 不 能 作 内 积累 加 。 如 果 1z} 之 7， 我 们 可 以 写 
2o000 = Lt VP Bt ys, (13.2) 
[2 
2cos0 sinO = 1/[1 + (yrs. (13.3) 
如 果 7 之 1z1 ,我们 可 以 写 出 相应 的 表达 式 《 见 第 三 章 $30) . 


更 疯 单 的 转角 计算 方法 

区 .在 某 些 计 算 机 上 用 $12 ~ 813 的 方法 确定 三 角 函数 计算 时 
间 和 存 及 空间 都 要 求 过 多 。 现 在 已 发 展 了 一 些 较 蔽 单 的 算 靶 计算 
转角 ， 

因为 任何 正 交 变换 保持 特征 值 不 变 ， 我 们 不 必需 定 转角 能 真 
未 压 锯 当 前 的 元 素 为 堆 . 只 要 我 们 大 幅度 压 镶 它 的 什 , 因 为 5 用 
纺 减 2(2 贸 》 一 2(a 多 9》 我 们 可 以 期 望 过程 收 做 。 然 而 ,为 了 保 
持 最 后 阶段 有 二 次 收 生性, 当 非 对 角 线 元 素 变 小 的 时 候 ,转角 应 该 
赵 近 用 传统 的 方法 计算 的 信 

一 个 方法 是 ,如 果 下 式 给 出 的 转角 加 弗 在 范围 (一 ,十 =) 
内 就 由 此 式 确定 

T= tan TB ops/2ape 一 oo)， (4.D) 


否则 , 令 由 一 土 二 ,符号 应 与 (14.1) 有 边 的 相同 。 比 较 (14.1) 和 
(12.1), 我 们 看 出 


=” 2387， 


tan20 一 tan 二 bs (14.2) 


次 此 当 8-* 0 时 ， 
$0~ 之 0a. (14.3) 
我 们 可 以 从 关系 式 
snp = 2T/(1 + T), cosb = (1 — T/T+ T?) (14.4) 
计算 sm 由 和 cos$, 并 且 因 为 | 了 | < 1, 用 定点 或 浮 点 计算 部 十 
分 简单 ， 容 易 检 证 ， 用 这 种 办 法 选取 转角 ， 旋 转 的 效果 等 价 于 用 
oa 内 代替 了 a 狠 , 其 中 o 满足 不 等 式 
0o<c< 寺 (1+ 29， (14.5) 
并 且 对 于 (14.1) 定义 的 很 大 范围 内 的 角 , o 缉 靠 近 零 .已 经 证 明 ， 
这 样 选择 转角 ,过 程 的 收 敏 速度 可 与 传统 的 方法 媲美 


过 关 Jacobi 方法 


15. 在 平面 (p, 9) 内 的 旋转 使 Exla 的 信 降 低 ,下 降 的 量 最 
多 是 2(aR. 如 果 内 小 了 非 对 角 线 列 的 一 般 水 平 ， 那么 {p, 

每 一 次 扫描 我 们 部 给 出 一 个 “ 关 值 ”， 在 六 次 拉 持 中 如 果 蘑 个 
非 对 角 线 元 素 低 于 关 值 的 就 不 作 相应 旋转 变换 。 在 DEUCE 上 用 
定点 运算 时 , 曾 用 了 关 值 ?2 ;2 ,2 ,2 .以 后 的 关 值 全 都 是 
2-”， 因 为 在 DEUCE 上 ，2-%， 是 最 小 的 数 , 因此 在 第 五 次 扫描 
之 后 仅仅 遇 到 零 元 素 才 省 略 相应 旋转 ，。 计 算 过 程 直 到 


(2) 


个 元 素 依次 全 都 可 以 省 略 才 停 上 . 在 DEUCE 上 的 经 验 表明 , 这 
个 改进 方法 在 速度 上 有 和 较 大 的 提高 。 值 得 注意 的 是 ， 这 样 做 收敛 
途 是 有 保证 的 。 因 为 对 二 任何 关 依 只 有 夺 限 次 汉代 ， 


在 SWAC 上 曾经 用 过 这 样 的 方法 (Pope 和 Tompkins 
(1957)), 预 先 给 基 个 不 值 ,然后 用 不 , 怠 , 如 作为 一 组 关 信 ， 对 每 
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个 关 信 , 迭 代 进 行 到 所 有 非 对 角 线 元 素 的 值 低 于 关 信 为 止 。 
特征 向 量 计算 


16. 如 果 最 后 一 次 旋转 是 R,, 那么 对 于 运算 精度 来 说 ,我 们 有 
等 式 


(Ri* RaRi)4oCRTRIRT) = diag(1;). (16.1) 
因此 ， 如 的 特征 向 量 是 矩阵 已 的 列 。 已 定义 为 ， 
已 一 RIRER (16.2) 


如 果 要 计算 特征 向 量 ， 在 过 程 中 的 每 一 步 我 们 可 以 保存 当时 的 乘 

积 PR， 

Pi = RIRi*~. RE, 《16.3) 

除 存储 A4 的 上 三 角 部 分 需要 二 (ww 十 #*) 个 存储 位 置 外 ， 情 需 

要 党 个 存储 位 置 .如 果 我 们 采用 这 各 格式 ,我 们 可 以 自动 获得 ”个 
特征 向 景 . 

如 果 只 要 几 个 特征 向 量 ,那么 只 要 我 们 保存 “os6, sin8 和 每 

次 旋转 ,我 们 就 可 以 节省 机 器 时 间 。 假定 只 要 一 个 特征 向 量 , 它 对 


应 于 最 后 一 个 对 角 型 diag(2) 的 第 i 个 对 角 线 元 素 。 那么 ,这 个 
特征 向 量 vi 为 


vi = RIRY.* RYe;. (16.4) 
如 果 用 R7 ,Ri-1,…,Ri 逐个 左 乘 ej, 我 们 就 得 到 第 i 个 特征 启 
量 而 不 必 计 算 其 余 的 特征 向 量 。 计算 P, 的 乘法 量 是 计算 vi 需 
要 的 乘法 量 的 * 倍 ,因此 计算 + 个 向 量 的 运算 量 是 计算 P 的 r+/s 
售 。 

由 于 完成 全 部 工作 平均 来 说 需要 五 次 或 六 次 扫描 ， 因 此 有 关 
旋转 的 存储 量 是 P, 的 若干 倍 。 自 然 在 有 磁带 存储 器 的 计算 机 上 
这 似乎 还 不 会 限制 我 们 要 处 理 的 矩阵 的 阶 数 。 


数值 例子 
J7- 在 表 3 中 用 实例 说 明 计算 个 别 向 基 的 技术 .我 们 计算 的 是 
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表 ! 的 例子 ,计算 了 对 应 第 二 个 特征 值 的 特征 向 量 。 


家 3 
0,8628 —0,5055 0 .0000 0 —0.0094 
vl0.5035 0.8628 0 0 1.0000 0 
0 1.0000J[o.0094 0 1.0000 
1.0000 0 0 0 
xj 0 0.9991 —0.0411| 1 
0 0.041 0.9991]o 
逐次 用 矩 降 线 得 出 
0.0000 一 0.0004 一 0.5054 
0.9991 |,| 0.9991 |， 最 后 得 | 0.8618 | . 
0.0411 0.0411 0.0411 


因为 已 是 正 交 和 矩阵 , 所 以 最 后 一 个 向 量 的 Euctid 范 数 是 1。 这 
可 以 用 来 检查 计算 机 运行 情况 和 度量 伟人 误差 的 积累 。 


Jacobi 方法 的 会 人 误差 


18, 第 三 章 $20 ~536 的 一 般 柱 分 析 没 有 完全 概括 Jscobi 方 
法 ,因为 在 这 里 cos6 和 sin9 的 计算 有 些 不 同 ， 然 而 ,我们 已 经 
说 明了 计算 的 cos6 积 加 9 与 对 应 于 当前 计算 的 矩阵 的 准确 值 
相 比 ,相对 误差 是 小 的 。 同 时 ,对 第 三 章 的 分 析 作 修改 是 相当 简单 
的 


在 第 三 章 的 结果 中 ， 如 果 sin8 和 cos9 是 按照 512 那样 计 
算 的 ,21.5) 式 中 的 因子 6 . 2 肯定 可 以 用 9 . 2 代替 ,我 把 有 关 
的 证 明 留 给 读者 作为 练习 .如 果 作 了 > 次 扫描 ,并 且 记 diag(ps) 为 
最 后 的 计算 的 对 角 乍 阵 ,那么 与 第 三 章 等 式 (27.2) 相对 应 ,我 们 有 

liiagCps) 一 RdoRrls < 18 + 27erni(1 + 9 277 yn Aole, 

《18.1) 
其 中 只 是 对 应 计算 的 屎 的 准确 的 正 交 抵 阵 , 它 由 准确 的 平面 旋转 
的 准确 的 乘积 得 到 。 如 有 果 我 们 取 > 等 于 6, 那么 我 们 有 
|idiag(w) 一 RAoRTis < 108 - 2- 和 二 1 十 9 - 27) nA, 
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(18.2) 
这 总 味 着 , 如 果 是 如 的 真 特征 值 ， 并 且 4 和 上 都 按 递增 次 序 
编号 ,那么 
2 一 2 
3 
最 后 的 因子 实际 上 是 不 重要 的 ,因为 如 果 右 边 充分 小 ;这 因子 几乎 
是 1.《18.3) 的 右边 是 一 个 极端 的 上 界 ， 我 们 可 以 希望 伟人 误差 
的 统计 分 布 将 保证 如 下 数量 级 的 界 

了 一 2 .2nd 

[ FA ] 11-2 。 (18.4) 

作为 例子 ， 落 取 (一 40，” 一 10"， 则 右边 近似 于 10“。 实际 上 ， 
这 说 明了 主要 的 限制 不 是 来 自 计 算 特征 值 的 精度 而 是 时 间或 存储 
量 ， 


J C108 2-ini(1 十 9 277)m-n, (18.3) 


计算 的 特征 向 县 的 精确 度 


19. 对 特征 值 的 误差 ,我 们 已 经 能 够 得 到 令 人 满意 的 严格 的 先 
验 界 ,但 是 ,对 于 特征 向 量 ,我 们 不 能 指望 得 到 同样 满意 的 界 ， 一 
般 来 说 ， 它 们 的 精度 不 可 和 避免 地 要 受 特 征 值 的 分 离 度 影响 。 如 果 
我 们 写 


diag( mw) 一 RARz 一 F, (19.1) 
那么 

diag( 1) 一 R(As + G)RT, (19.2) 
其 中 

G= RIFR, I|Gls = IlFlle, (19.3) 


其 使 我 们 能 准确 地 计算 RT， 号 只 能 得 到 (46 十 6G) 的 特征 向 量 . 
事实 上 ,我 们 做 不 到 完全 准确 。 我 们 有 的 只 是 计算 的 旋转 ,而 
把 对 应 的 矩阵 乘 到 一 起 又 要 产生 误差 。 记 中" 为 计算 的 乘积 ， 那 
么 按照 第 三 章 825, 用 常数 9 - 2 代替 那里 的 x, 我 们 得 到 

|RY 一 Rs E9277 十 9 27 0, (19.4) 
仍 取 + 一 6, 并 假定 有 一 个 适当 的 误差 分 布 , 那 么 我 们 可 以 期 望 界 
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大 致 是 
有 及 一 Re < 8o2 一 . (19.5) 

因此 ,计算 的 矩阵 下 "十 分 娃 近 准确 的 正 交 甜 阵 RT 

现在 我 们 已 得 到 RT 与 (4。 十 G) 的 准确 的 特征 向 量 矩 陈 RT 
的 偏差 的 界 ,并 且 我 们 也 有 了 G 的 界 .。 界 (19.4),(19.5) 都 不 依赖 
于 特征 什 的 分 离 度 。 即 使 4。 有 一 些 很 接近 的 特征 值 ,而 对 应 的 特 
征 向 量 可 能 很 不 精确 但 却 几乎 是 准确 地 正 交 的 . 显然 ， 它 们 张 成 
一 个 正确 的 子 空间、 并 且 给 出 完整 的 数字 信息 ， 这 也 许 是 Jacobi 
方法 最 令 人 满意 的 特点 。 这 一 章 我 们 描述 的 其 他 方法 无 论 在 速度 
上 或 精度 上 都 比 Jacobi 方法 好 , 但 要 得 到 对 应 于 很 靠近 的 或 重合 
的 特征 值 的 正 交 特 征 向 量 却 相当 困难 的 . 


用 定点 计算 的 误 总 界 


20. 用 类 似 于 第 三 章 $29 的 方法 ,我 们 可 以 得 到 定点 计算 的 特 

征 值 的 误差 界 .精确 的 界 依赖 于 计算 cosg 和 sin9 的 具体 方法 。 
但 它们 都 具有 如 下 形式 

diag(mu) 一 RART, < Krai2™, {20.1) 
或 者 

Ndisg(1m) 一 R4oRzjls < Karnn2r, (20.2) 
这 取决 于 我 们 是 用 2 范 数 还 是 Eudid 范 数 。 这 里 + 仍然 是 扫 
接 次 数 。 与 第 三 章 $32,$33 一 样 ,我们 假定 4 一 开始 就 引 人 了 比 
例 因子 使 得 


Ao & 1 ~— Krai2™, (20.3) 
在 这 条 件 下 得 到 了 不 等 式 〔20.1)。 这 个 条 件 是 很 难 满足 的 , 因为 
通常 我 们 在 算 完 这 问题 之 前 无 法 准确 地 估计 4o。 另 一 方面 ， 
(20.2) 是 在 假定 了 4o 引入 了 初始 比例 因子 使 得 

asls < 1 — Karnm2™ {20.4) 
的 条 件 下 获得 的 ,条 件 (20.4) 是 容易 实现 的 ,因为 4ojz 很 容易 计 
算 。 比例 因子 保证 了 任 一 个 44 中 没有 一 个 元 素 超 出 机 器 的 数字 
表示 范 国 。 
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再 用 一 个 类 似 于 第 三 章 $34 的 方法 。 我 们 发 现 计算 的 旋转 的 
计算 乘积 RK" 满足 关系 


[RT 一 RY: & Kyrn2-, (20.5) 
其 中 RT 是 (44 十 G) 的 准确 特征 向 量 矩 阵 , 并 且 我 们 有 
| 入 Kirp%22… 或 者 1Gj < 后 rmp22 (20.6) 


与 浮 点 计算 的 情况 一 样 ,对 于 任何 适当 的 # 值 ,RR" 是 几乎 正 交 的 ， 
正 交 性 不 依 束 于 它 的 列 和 4。 的 真 特征 向 是 有 多 接近 。 


程序 编制 问题 


34 Jacobi 方法 的 一 个 麻烦 是 ， 每 次 变换 都 要 修改 当前 矩阵 
的 两 行 、 两 列 ， 如 果 计 算 机 内 存 足以 存储 这 个 矩阵 ， 困 难 并 不 看 
在 . 但 是 如 果 内 存 不 足 , 似 乎 没有 一 个 很 满意 的 Jacobi 方法 的 程 
序 编制 办 苇 。 Chartres (1962) 曾 描述 一 个 Jacobi 方法 的 修正 形 
式 ， 它 很 适合 在 有 了 磁带 机 作 外 存 的 计算 机 上 使 用 。 这 一 技巧 的 详 
细 令 述 请 参阅 Chartres 的 论文 。 


Givens 方法 


22. 按 特 性 来 说 ，Jacobi 方法 本 质 上 是 迭代 法 ， 下 面 我 们 要 
馆 述 的 钠 个 方法 ,基本 思想 是 不 完全 简化 原 矩 阵 , 用 正 交 相似 变换 
产生 一 个 对 称 三 对 角 和 抢 阵 (第 三 章 $13)， 这 样 的 简化 可 用 本 质 上 
不 是 选 代 的 方法 实现 ， 因 而 需要 的 计算 量 要 小 得 多 ， 因 为 计算 对 
称 三 对 角 和 矩阵 的 特征 值 比较 简单 ,因此 这 两 个 方法 十 分 有 效 ， 

第 一 个 方法 是 Givens (1954) 提出 的 , 是 以 平面 旋转 为 基础 
的 方法 。 它 由 (2 一 2) 个 主 步 构成 ,第 ? 步 在 第 7 行 ,第 7 列 产 
生 零 元 素 ,但 不 改变 前 (r 一 1) 步 产生 的 零 元 寨 ， 在 第 步 开始 
时 ,矩阵 的 前 + 一 1 行 、? 一 1 列 已 是 三 对 角 型 的 . 对 n 一 6,+ 二 3 
的 情况 , 抱 降 的 形状 是 
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x x10 0 0 
x x ,x 9 0 0 
i 上 

! 
0 XXX x x {22.D) 
0900 ix x x xl 

! 
oo x x x xic 
oo lx x x xj 

人 + + 


第 7 主 步 由 (n 一 + 一 1) 个 子 步 构 成 ,它们 逐次 在 第 ? 行 、r 
列 的 第 "十 2,r 十 3,…, 4 个 位 置 引 人 去 元 素 ， 在 第 i 个 位 置 
的 零 元 素 是 由 (+ + 1,) 平面 的 旋转 产生 的 ,在 (22.1) 中 下 面 加 横 
线 的 元 素 是 第 * 主 步 要 消去 的 ,用 箭头 指明 那些 行列 要 受 影响 。 
明显 地 ,前 (7 ~ 1) 行 \ 列 完全 不 变 ， 在 这 些 行列 范围 内 的 零 元 素 
是 由 零 的 线性 组 合 代替 的 .在 第 * 主 步 中 ， 实 际 受 影响 的 仅仅 是 
当前 矩阵 的 右 下 角 (x 一 ? 十 1) 阶 子 矩 阵 . 

为 了 容易 和 平面 旋转 的 三 角形 化 (第 四 章 350) 相 比较 ,我 们 首 
先 给 出 一 个 算法 揪 述 这 个 方法 ,这 里 假定 了 在 整个 过 程 中 ,整个 矩 
阵 存储 在 内 存 中 。 当 前 的 cos9 和 sin6 值 存 放 在 两 个 被 消去 的 
对 称 的 元 素 的 存储 位 置 上 。 第 7 主 步 表述 如 下 : 

对 于 从 ?十 2 到 * 的 每 一 个 值 执行 (i) 到 (iv) 步 : 

(D 计算 x 一 (2 十 a 

人 《ii) 计算 cos6 一 arrrajz，sin8 一 erfr, 《如果 > 一 0, 我 
们 令 cos9 一 1 和 sin9 一 0， 并且 省 格 ( 诈 ) 和 (iv).) 把 cos6 
积 sin8 分 别 覆盖 在 a 和 mr 上 ; * 覆盖 在 arr 上 ; aywir 和 
* 在 原 位 置 上 ,是 已 修正 的 新 入. 

《ii) 对 于 从 ”+ 1 到” 的 每 个 值 : 
计算 airyacos9 十 wsing 和 一 airnsin0 十 ajicos9 并 医 访 于 
gen 及 ai 上 . 

(iv) 对 于 了 从 > 十 1 到 ”的 每 一 个 值 : 
计算 wsafeosg + ousinb 和 一 mrufsing 十 aiicos8 并 分 别 覆 六 
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于 grr 和 mi 上. 
实际 上 ,我 们 不 必 作 (ii), (iv) 的 全 部 ,因为 ,根据 对 称 福 , (iv) 
廊 要 是 对 行 重复 (说 ) 中 对 列 热 行 过 的 计算 .通常 我 们 只 对 上 三 角 
逆 分 运算 ,而 一 次 旋转 所 涉及 的 元 素 如 癌 (11.1) 所 永 的 .但 是 要 注 
意 , 如 果 要 存放 cos8 和 sn6 的 信 , 我 们 必须 有 志 个 存储 位 置 . 
23. 第 " 步 的 乘法 次 数 ， 在 充分 利用 对 称 性 的 情况 下 ， 约 为 


4(s 一 小。 因此 ,完成 整个 矩阵 三 对 角 化 约 需 生 m 次 乘法 。 我 们 


可 以 比 较 一 下 ，jacohi 方法 一 次 扫描 中 需要 2m 次 乘法 。 另外 ， 
第 Givens 简化 和 Jacobi 方法 的 一 次 要 手中 部 有 大 约 二 wm” 个 开平 


方 运算 . 最 后 ,在 Givens 方法 中 转角 的 计算 要 简单 得 多 。 假定 在 
Jacobi 方法 中 用 了 六 次 扫 插 , 那么 Jacobi 方法 需要 的 工作 量 约 是 
Givens 简化 的 工作 量 的 九 信之 多 ， 对 大 的 = 更 是 要 九 倍 以 上 .只 
去 三 对 角 和 矩阵 的 特征 值 能 比较 快 求 得 ,那么 Givens 方法 比 Jacobi 
方法 快 得 多 . 


在 有 两 级 存储 设备 的 计算 机 上 实现 Givens 方法 


24. 在 有 内 外 两 级 存储 设备 的 计算 机 上 ， 如 果 像 $22 中 那样 
使 用 Givens 方法 , 其 功效 是 相当 低 的 。 即 使 我 们 利用 了 对 称 性 ， 
但 我 们 发 现在 每 一 主 步 涉及 到 行 和 列 的 传递 。 例 如 ， 如 果 上 三 角 
形 部 分 按 行 在 外 存储 器 存放 ， 第 * 主 步 中 第 + 行 到 第 4 行 必定 对 
每 一 个 子 步 都 要 在 内 外 存 之 间 反 复 传 送 ， 但 除了 旋转 平面 对 应 的 
两 行 外 ,一 般 的 行 只 有 两 个 元 素 受 影响 ,现在 我 们 叙述 一 个 Rollerr 
和 Wilkinson (1961) 和 Johansen (1961) 发 展 的 修正 方案 ;在 整 
个 第 主 步 中 ,第 行 到 第 = 行 只 需 来 回 传送 一 .次 . 

在 第 * 主 步 中 ,前 (7 一 1) 行 、 列 不 参加 运算 ,第 + 主 步 形式 
上 与 第 一 主 步 一 样 ,只 不 过 是 运算 仅仅 对 简化 后 的 右 下 角 (x 一 
十 1) 阶 和 矩阵 实 行 ， 于 是 ,不 失 一 般 社 , 用 第 一 主 步 来 描述 这 个 方 
法 这样 傣 也 更 为 方便 ， 襄 内 存 信 于 中 表 认 四 个 数组 。 生 组 有 
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个 单元 -第 一 主 步 有 五 个 部 分 .( 因 为 有 一 部 分 元 素 在 内 存储 器 ,有 
一 部 分 在 外 存储 器 ， 我 们 的 叙述 与 以 前 使 用 过 的 算法 语言 稍 有 不 
同 ，) 
(1) 传送 4 的 第 一 行 到 数组 1. 
(2) 对 于 从 3 到 ”的 每 一 个 值 计算 ， 
4 [ao 十 acosboi 一 /es sin Oy = oi/ #1 


其 中 


a =am 和 oD = 
把 cos6:; 覆盖 在 ca 上 ，sin 60; 存储 在 数组 2 中。 

《3) 传送 第 二 行 到 数组 3，。《 这 一 行 及 以 后 各 行 都 只 用 到 对 
角 线 及 对 角 线 以 上 的 元 素 .) 对 于 《从 3 到 * 的 每 一 个 值 执行 (4) 
和 (5): 

《4a) 传送 第 不 行 到 数组 4。 

(4b) 对 当前 的 元 素 mayek 和 att 执行 行列 运算 ， 运 算 包 
括 cos024 和 sinBx。 

(4c) 对 工 从 下 十 工 到 ?的 每 个 值 ， 对 sr 和 ou 执行 行 变 
换 ,变换 包括 cosb6k 和 sin .4。 

(4d) 对 于 2 从 多 十 1 到 # 的 每 一 个 值 ， 对 mk 和 at 执行 
列 变换 ， 变 换 包括 cos6, 和 sin 86,4， 并 且 根 据 对 称 性 利用 了 
au 一 ata 这 一 特点 。 对 于 给 定 的 《4a), (4b), (4c) 和 (4d) 
全 部 做 完 之 后 ， 第 一 主 步 的 所 有 变换 对 《 行 的 全 部 元 素 及 第 二 行 
的 3,4,…; 尖 元 素 都 已 执行 ， 第 二 行 的 2,K 十 1 《十 2 3a 元 
豪 仅 仅 受到 售 有 bg ,9 的 变换 的 影响 ， 

{5) 把 已 算 完 的 第 不 行 传送 到 外 存储 器 ,并 转 到 《4a)》 做 下 一 
个 大 的 计算 ， 

25. 当 我 们 对 所 有 适当 的 不 值 执行 了 (4),(5) 之 后 ,第 二 行 的 
计算 也 全 部 完成 。cosbk 和 sinpk(K 一 3, 到 #) 和 第 一 行 中 修 
改过 的 元 素 ( 即 三 对 角 和 矩阵 的 头 两 个 元 素 ) 可 以 存 到 外 存储 器 ， 并 
把 第 二 行 传送 到 数组 1。 因为 第 二 行 在 第 二 主 步 中 的 作用 相当 于 
第 一 行 在 第 一 主 步 中 一 样 ， 对 于 第 二 主 步 来 说 ， 现 在 已 作 好 了 准 
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备 ， 在 以 后 的 各 步 中 (1) 是 不 必要 的 ,因为 需要 的 行 已 经 在 内 存储 
器 


应 该 着 重 指出 ,我 们 刚才 描述 的 过 程 只 不 过 是 Givens 方法 的 
一 种 新 的 安排 。 虽 然 在 一 个 主 步 中 某 些 后 面 的 变换 的 部 分 工作 提 
前 进行 ， 但 是 受 这 后 面 的 变换 影响 的 元 素 是 不 受 前 头 的 变换 支配 
的 .这 两 个 格式 就 运算 量 和 合 人 误差 来 说 是 完全 相同 的、 而 后 者 
大 幅度 减少 了 内 外 存储 器 之 间 的 信息 传送 次 数 ， 

在 外 存储 器 中 分 配 ww 个 存储 位 置 用 于 存放 整个 矩阵 是 方便 
的 ,尽管 下 三 角 部 分 元 素 不 用 到 ,但 是 需要 满 矩阵 的 存储 量 以 便 存 
放 正 弦 和 余弦 。 如 果 要 计算 特征 向 量 ， 这些 量 是 必须 保存 的 . 
(25.1) 展示 了 一 种 方便 的 存储 方法 。 用 这 种 存储 方法 ,“ 检 索 ” 运 
算 特别 简单 。 


a dy cos cosOys cosbas 
* G2 23 cosD cosOss 

sinO,s x Gs Gy cosB (25.1) 

din sinOys > a a 

sinp sinOs, sinb,, x a 


Johansen 《1961) 指出 ,如 果 每 次 从 外 存储 器 传人 名 个 字 ， 那 
么 内 存储 器 的 需要 可 以 从 4n 个 单元 压缩 为 3n 十 《 个 单元 ,因为 
在 内 存储 器 中 不 需要 同时 使 用 4 的 整 行 。 


Givens 方法 的 泽 点 误差 分 析 


26. 为 了 得 到 原 问 题 的 解 ,我 们 必须 求解 三 对 角 短 阵 的 竺 人 征 什 
问题 ， 因 为 我 们 毛 着 介绍 的 方法 也 导致 三 对 角 和 矩阵 ， 所 以 把 这 个 
问题 暂时 放 在 一 边 ,而 先 给 出 简化 为 三 对 角 型 的 误差 分 析 。 
显然 第 三 章 $20 ~ 826 给 出 的 普遍 性 分 析 完 全 概括 了 Givens 
笠 化 方法 。 甚 至 旋转 角 的 计算 都 描述 了 。 如 果 我 们 用 C 表示 计算 
的 三 对 和 矩阵 ,用 R 才 未 对 应 计算 的 A4 的 二 (a 一 (x 一 2 个 
准确 旋转 的 准确 乘积 ， 那 么 对 于 标准 的 浮 点 运算 ， 由 第 三 章 等 式 
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(27.2) 我 们 有 结果 : 
上 lc 一 RdoRazjls < 12.2-in¥(1 + 6.277)" "Aolls, (26.1) 
全 得 注意 的 是 , 在 第 三 章 $22 描述 的 意义 下 ，Givens 方法 包 
含 的 旋转 不 是 完全 组 。 因 为 没有 第 一 个 平面 旋转 ，。 对 于 这 样 的 旋 
转 简 化 组 ,那里 给 出 的 界 显然 是 更 加 宽裕 的 、 
界 (26.1) 没有 利用 逐次 被 简化 的 矩阵 零 元 素 愈 来 愈 多 的 特 
点 ,而 要 做 到 这 一 点 的 确 也 不 是 简单 的 事 。 但 是 ,我 们 可 以 想像 这 
样 的 分 析 至 多 是 把 (26.1) 的 因子 12 压缩 一 点 ， 无 论 那 一 种 情况 
我 们 必定 有 
[ze 2 所 12 .2-8I 4 6 27)"", (26.2) 
其 中 A 是 计算 的 三 对 角 和 矩阵 的 特征 值 . 它 可 以 和 18.3) Jacobi 
的 界 相 比 较 。 在 $40~$41 中 我 们 要 说明 在 计算 三 对 角 抑 阵 的 特 
征 值 时 产生 的 误差 与 (26.2) 的 界 相 比 是 微不足道 的 。 


定点 误差 分 析 


27. 第 三 章 $29 ~ $35 的 一 般 的 定点 分 析 也 可 站 接应 用 于 Gi- 
vens 简化 方法 , 但 此 时 很 容易 利用 简化 过 程 中 产生 的 零 元 素 。 在 
第 * 主 步 中 ,我 们 处 理 的 是 ( 一 ” 十 1) 险 矩 阵 而 不 是 * 险 的 , 因 
此 在 第 三 章 (35.17) 的 界 中 我 们 应 该 用 (2 一 2r 一 2)4 来 代替 
(24 一 4 六。 结合 这 个 修改 ,我 们 自然 得 到 


lc ~ RAR E27 [(2 一 2r 一 2 六 


十 9.0](2 一 一 扫 
RT 2 § mx 
< 人 才 十 4.5 ) 。 (27.1) 
其 中 我 们 假定 4 已 被 平衡 ,使 得 
id < 1 一 xz (27.2) 


类 似 地 ,我 们 可 以 证 明 
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ec ~ RARTs < 7"(4 ni om) my, (27.3) 


这 里 我 们 也 假定 4 已 被 平衡 使 得 

ldolls <1— y. {27.4) 
(27.1) 中 涉及 吓 的 那个 因 于 和 (27.2) 是 过 宽 的 。 详 细 的 分 析 大 峰 
能 压缩 许多 。 但 是 对 于 充分 大 的 4, 在 任何 情况 下 总 是 有 w 的 那 
一 项 占 优 。 


数值 例子 


28. 现在 我 们 给 出 一 个 Givens 方法 的 数值 例子 。 它 是 专门 设 
计 来 说 明 这 个 方法 的 数值 稳定 性 的 本 质 的 。 我 们 总 是 强调 ， 最 后 
的 三 对 角 和 矩阵 十 分 接近 逐次 计算 矩阵 4, 的 准确 正 交 变 换 应 用 于 
4 得 到 的 矩阵 、 我 们 不 要 求 三 对 角 和 矩阵 接近 于 全 过 程 都 用 准确 
的 计算 所 得 的 矩阵 。 但 只 要 我 们 最 后 得 到 的 特征 值 和 特征 向 量 遂 
近 4 的 特征 值 和 特征 向 量 、 上 述 逢 隆之 闻 是 否 毛 近 是 无 关 紧 要 
的 。 
在 表 4 中 我 们 首先 列 出 用 定点 运算 把 一 个 五 阶 和 矩阵 简化 为 三 
对 角 型 ， 计 算是 取 五 位 十 进 制 数字 进行 的 。 当 在 位 置 (1,5) 中 引 
入 零 元 素 时 ,在 (2,3),(2,4),(2,5) 中 所 有 的 元 素 都 因为 相约 的 不 
因 变 得 十 分 小 、 这 些 元 素 与 准确 计算 的 结果 相 比 ,相对 误差 大 . 因 
此 , 当 我 们 确定 (3,4),(3,5) 的 平面 旋转 时 ,其 旋转 角 与 准确 计算 
的 差别 很 大 。 
我 们 用 六 位 十 进位 重复 计算 来 着 重 指明 这 一 点 。 现 在 (2,3)。 
(2,4),(2,5) 元 素 分 别 是 
0.000012,0.000007。0.000008; 
对 于 五 位 十 进位 的 计算 结果 分 别 是 
0.00002，0.00001，0.00001。 
例如 ,在 (3,4) 昱 面 的 旋转 ,上 述 两 种 稍 况 分 别 有 tang 一 7/12 和 


rang ~ 二 因此 ,在 最 后 的 两 个 三 对 角 矩 阵 中 ,后 面 有 关 的 行 、 列 
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表 1 


0.71235 0-33973 0.28615 0.30388 0.29401 
1.18585 一 0.21846 —0.06685 —0.37360 


一 0.18159 0.27955 。 0.38898 
0.23195 。 0.20496 
0.46004. 

用 二 位 十 进位 简化 


在 第 一 行 申 引 进 零 之 局 得 到 矩阵 4 
0.71235 0.61325 
0.61874 0-00002 0.00001 0.00001 


一 0.81366 0.51237 0.61325 
0.21436 0.21537 
0.41267- 
在 第 二 行 引进 零 之 后 得 到 矩阵 4 
『0.71235 0.61325 0 0 9 
0-61874 0.00002 0 0 
A,= 1.44135 0.02405 0.11049 
一 0-07568 —0.1032B 
0.03502. 
最 后 的 三 对 角 甜 阵 4， 
T071235 0.61325 9 0 o 
0-61874 0.00002 0 0 
一 1.48135 0.1]30B 站 
一 0.01292 。 0-11694 
- —0.02774 
用 六 位 十 选 位 简化 
在 第 一 行 中 引进 办 之 后 得 到 矩 陈 4 
0.712350 0.613236 0 0 0 
0.618749 0.000012 0.000007 0.000008 
= 0.813654 0.512374 0,613255 
0.214360 0.215375 
0 和 2665 


在 第 二 行 由 引进 办 之 后 得 到 短 降 尹 
0.712350 0.613256 
0.618749 0.000016 


而 一 1.486333 —0.068499 。 0.024712 
一 0.079492 一 0-102483 
0.033837 


最 后 的 三 对 角 和 矩阵 4。 
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0.712350 0.6]3256 0 o 0 
0.618749 0.000016 0 0 
d= 1.486335 0.072820 0 
一 0.001012 一 0.115055 
一 0.04 由 43 
准确 八 位 十 进位 的 特征 位 
4 4s( 用 五 位 十 进位 计算 ) 44( 用 六 位 十 进位 计算 ) 
1.48991 259 1.48991 000 1.48991 239 
1 28058 937 1.28057 855 1-28058 B869 
一 0.14126 880 一 0.14126 174 -~—0.14126 895 


0.09203 628 0.09204 175 0.09203 657 
0.05051 055 0.05054 145 0.05051 030 


几乎 完全 不 同 。 但是, 我们 的 误差 分 析 表明 ,这 两 个 三 对 角 抵 阵 的 
特征 值 都 带 近 于 4 的 特征 值 。 

在 表 4 中, 我们 列 出 这 两 个 三 对 角 矩 阵 和 4 的 特征 值 ， 准 确 
到 八 位 十 进位 。 这些 结 果 证 实 了 我 们 的 结论 .值得 注意 的 是 ， 在 
两 种 情况 中 ， 整 个 简化 过 程 产生 的 含 人 误差 对 每 一 个 特征 值 的 影 
网 小 于 计算 中 使 用 的 最 后 一 位 数字 位 的 一 个 单位 、 实 味 上 ， 我 们 
发 现 真 正 的 误差 总 低 于 我 们 得 到 的 上 界 、 通 党 比 利 用 绕 计 结果 的 
粗糙 估计 给 出 的 界 要 低 得 多 . 

注意 ,在 (3,4) 和 (3,5) 平 面 旋转 中 ,我 们 确实 有 相当 大 的 选择 
让 由 。 鲍 如 , 当 我 们 作 (3,5) 平面 旋转 时 ,我 们 只 是 远 取 cos8 和 
sin 9, 使 得 它们 在 运算 精度 范围 内 是 匹配 的 。 因 此 ,以 六 位 十 进位 
为 例 ， 


1 一 (0.000012) sin6 十 (0.000007ycos6| < 到 L107 


一 0.000007 
我 们 本 坟 的 方法 使 得 9 与 uang 一 -0200007 所 给 定 的 伟 十 分 


一 致 ,并 且 这 样 做 是 最 容易 的 。 但 是 对 于 tan9, 任 何 满足 
0.0000065 < * 过 0.0000075 和 0.0000115< 》 < 0.0000125 
的 x/y 值 都 会 一 样 好 ,而 这 些 值 对 应 的 最 终 的 三 对 角 和 矩阵 变化 范 
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围 很 大 。 

表面 上 看 来 、 这 是 使 人 惊奇 的 .现在 先 让 我 们 到 准确 的 计 
算 ， 并且 假定 当 ss 被 消去 时 出 现 完全 相约 使 得 (2, 3)，(2, 4)， 
(2,5) 元 素 变 为 零 。 那 么 ,在 (3,4),(3,5) 平面 的 任何 准确 旋转 会 
保持 这 三 个 零 元 素 不 变 , 我 们 可 以 抬 它 看 作 一 个 适当 的 Givens 变 
换 、 不 同 的 旋转 会 给 出 不 同 的 最 终 的 三 对 角 和 矩阵 ， 但 全 都 准确 地 
相似 于 如 。 在 准确 的 过 程 中 出 现 完全 柏 消 时 ,。 我们 可 以 任意 地 在 
对 应 的 旋转 角 中 选 “全 部 数字 位 ”。 


Householder 方法 


29, 多 年 来 ,似乎 证 明了 Givens 方法 是 简化 矩阵 为 三 对 角 型 
的 最 有 效 的 方法 ,但 1958 年 Householder 指出 ， 这 种 简化 用 初等 
Hermite 正 交 矩 阵 来 作 比 用 平面 旋转 更 有 效 .在 秆 六 章 $7 中 ,我 们 
说 明 Givens 和 Householder 方法 实质 上 是 一 样 的 。 

在 这 衡 化 过 程 中 有 ( 一 2) 步 ,第 ， 步 在 第 行 ,第 * 列 产生 
零 元 素 但 不 破坏 以 前 各 步 引进 的 零 元 素 ， 对 "= 7。r 一 4 的 迟 
况 , 第 " 步 以 前 乱 阵 的 形状 是 


x x 1 
! 
x x x | 1 
r ! 1 0 
x x xX) c bi 
A x xix x x|= 1 | ， 
一 一 -上 
XIX XX| LoloBs 
nr {xixxx i 
i xix x x! 
(29.1) 


其 中 Bs 是 有 (sr 一 +) 个 分 量 的 向 量 ，C,-! 是 + 阶 三 对 角 短 
阵 ，B,-: 是 (sn 一 +) 阶 方 阵 、 第 * 个 交换 的 矩阵 P, 可 表示 为 
如 下 形式 


rtf rio I! 0 
已 一 | 一 二 |-| 和 | (29.2) 
2 一 rt 0190. 0 TT —2vw7 
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其 中 是 有 人 na 一 +) 个 分 重 的 规格 化 向 量 ， 因 此 我 们 有 


r{ 1 0 
Ch， 二- 
A PAP ™ 1 eo | {29.3) 
es ee 
n—r{l 0 ie 19.89。 
其 中 
er™ Ob (29.4) 


我 们 如 果 选 取 v, 使 得 c, 除 了 第 一 个 分 最 之 外 全 是 零 ,那么 4, 的 
前 (r + 1) 行 , (r 十 1) 列 是 三 对 角 型 。 这 样 我 们 已 得 出 了 确定 第 
三 章 $37，$38 研究 过 的 标准 型 中 的 只 的 条 件 ,但 是 这 里 用 现在 的 
记号 改写 一 下 结果 要 为 方便 .我 们 略 去 下 标 > 用 mi 表示 4 的 
(i, 仆 元 案 ， 我 们 假定 只 存储 上 三 角 部 分 的 元 素 , 并 用 这 些 元 素 表 
示 全 部 公式 
如 果 我 们 用 和 矩阵 P, 一 了 2w,w! 来 讨论 ,公式 是 最 简单 的 、 
这 里 w, 是 有 "个 分 量 的 规格 化 商量， 前 7 个 分 量 是 零 。 于 是 我 
们 有 
书 一 了 一 2mraoJ 1 ut 2K, (29.5) 
其 中 
Wir (G12 7), 
Wrrlr 一 Oo 于 Sr Wir ™ Gf 全 一 ”十 2 站 1), (29.6) 
s, -( 六 a 2K? 一 中 二 arts 
mr “ 
在 决定 w+ 的 等 式 中 ,Sr 前 的 符号 取 定 为 与 .etl 的 符号 一 致 ， 
这 样 可 以 使 得 在 作 加 落 时 不 会 发 生 相 约 。arrr 的 新 值 是 土 S, 《我 
们 可 与 Givens 方法 对 比 一 下 .在 Givens 方法 中 , 采用 我 们 的 公 
式 ,三 对 角 型 的 上 对 角 线 元 素 是 非 负 的 )。 注意 ， 如 果 某 一 步 要 消 
去 的 元 素 已 全 是 零 ， 这 个 变换 矩阵 并 不 是 我 们 可 能 想象 的 单位 和 矩 
阵 (事实 上 ， 按 我 们 的 定义 , I 不 是 一 个 初等 Hermite 矩阵 )， 这 
个 变换 矩阵 与 单位 矩阵 的 差别 是 第 (+ 十 1) 个 对 角 线 元 素 是 一 1。 
我 们 可 以 编制 程序 发 现 这 个 情况 并 省 路 有 关 的 变换 。 
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利用 对 称 性 
30, 充分 利用 对 称 性 的 特点 是 重要 的 ， 而 为 了 做 到 这 一 点 :从 


4 一 六 4 ‘30.1) 
计算 4, 需要 细致 地 制订 计算 公式 .事实 上 ,我 们 有 
A (T — wnT 2KRI) A — unt/2K). (30.2) 
如 果 我 们 记 
A 2K? = Pss (30.3) 
等 式 (30.2) 就 可 写 为 
本 一 4 一 4 一 Pr + uwipr ut /2K. {30.4) 
因此 ,如 时 我 们 定义 4, 为 
qr br — BukuIp,/2K?). (30.5) 
我 们 有 
A Ar — Wg — qu?, {30.6) 


等 式 右边 是 利用 对 称 性 的 好 形式 .实际 上 ,我 们 感 兴趣 的 仅仅 是 4 
右 下 角 的 (n 一 亲 阶 矩阵 ,因为 前 (r 一 IT) 行列 与 4 的 相 
而 且 变 换 P, 是 设计 成 消去 sa 人 一 7 十 2,… ,8) 并 把 zt 变 
为 二 5,。 

容量 p; 的 头 (7 一 1) 个 分 量 是 霍 , 并 且 第 个 元 素 也 不 需 
要 计算 .因此 , 它 的 计算 中 包含 (# 一 小 次 葬 法 ， 在 4. 的 计算 
中 包含 的 运算 量 是 (” 一 ") 数量 级 ,与 全 部 计算 要 比 是 可 忽略 的 . 
最 后 从 (30.6) 式 , 计算 4, 的 有 关 元 素 约 需要 (sn 一 +)* 次 乘法 ， 
因为 我 们 只 须 计 算 上 三 解 部 分 的 元 素 。 在 整个 简化 方法 中 总 葬 法 


量 是 社 台 次 ,而 Givens 方法 是 子 中 次 , 在 这 赛 公式 中 只 有 
个 平方 根 运 算 , 而 在 Giveos 方法 中 有 十 对 个 。 


容 储 方案 的 研究 
31. 如 果 我 们 需要 特征 向 量 ， 变 换 矩 阵 的 详细 信息 必须 保存 。 
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显然 保存 ww 的 非 堆 元素 以 及 能 使 2K; 可 以 恢复 的 充分 的 信息 
是 足够 了 ， 现在 向 量 w 有 (” 一 ”) 个 非 吉 元 素 , 而 它 只 消去 了 
4 的 (4 一 7 一 1) 个 元 案 、 (7,r 十 1) 元 素 不 变 为 堆 , 事实 
上 它 是 最 后 的 三 对 角 矩 阵 的 上 次 对 角 线 元 素 ， 但 是 , 单独 存储 这 
些 上 次 对 角 元 素 是 方便 的 ， 因 而 我 们 可 以 把 w 的 全 部 非 零 元 素 
存储 在 原 矩 阵 占有 的 位 置 上 ， 这 样 做 特别 方便 ,因为 
tr mean (二 二 2) 

因此 ，w 的 全 部 元 素 除 了 wt 之 外 都 有 了 存储 空间 。 

逐次 产生 的 户 可 以 存放 在 同一 组 4 个 单元 内 ,并 且 每 一 个 9， 
又 可 著 盖 在 p, 上 。 因为 g;, P。 中 仅 有 (ea 一 +) 个 元 素 要 保留 ， 
一 县 算出 上 次 对 角 线 元 素 , 士 % 就 可 存放 在 这 有 ”个 单元 的 同一 
组 内 .由 土 8 和 wsiw 我 们 在 需要 时 可 以 恢复 2K;, 所 用 的 关系 
式 是 

2 了 一 BF aes, 一 SS 于 anrt) = —(+8 ur (31.1) 


因此 ,全 过 程 仅 需 到 如 十 32) 个 存储 单元 ， 但 是 ,对 Givens 方 
法 如 果 也 要 存储 变换 的 详细 信息 ， 纪 个 单元 是 必需 的 ， 


在 有 内 \ 外 存储 设备 的 计算 机 上 实现 Householder 方法 


32. 如 果 在 有 内 、 外 两 级 存储 设备 的 计算 机 上 按 上 一 节 描 述 的 
方式 实现 Householder 方法 ， 那 么 在 第 + 步 中 B,-: 的 上 三 角 部 
分 元 素 〔 参 见 等 式 (29.1)) 必须 传递 到 内 存储 器 两 次 ， 一 次 是 为 
了 计算 名， 另 一 次 是 为 了 导出 4， 的 元 素 . 在 $24 描述 的 修正 
Givens 方 靶 中 每 一 步 仅 需要 作 一 次 传送 ， 下 述 方法 可 以 达到 同样 
节省 的 效果 。 

4 的 计算 过 程 涉及 从 外 存 读 进 4,-， 和 用 4, 代替 它 , 因此 
在 计算 过 程 中 wa， 和 py 也 可 以 被 计算 。 4。 与 dr- 的 差别 
仅 是 第 7 行 \ 列 到 第 * 行 \ 列 。 一 旦 知道 4; 的 《+ 十 1) 行 之 后 ， 
就 可 以 计算 wwr。 当 4, 的 每 一 个 元 素 被 确定 后 ， 它 就 可 以 用 来 
计算 4w,+， 中 有 关 的 部 分 。 因 为 我 们 假定 只 用 上 三 角 部 分 运算 ， 
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4, 的 计算 的 (i, 他 元 素 必 定 用 来 决定 对 《4 和 《Arns)i 
的 贡献 。 当 4, 贷 完 并 传送 到 外 存储 器 时 ，wi 和 4rs 就 被 
决定 了 ,因而 2K;，ph 和 gh 的 计算 不 再 需要 用 外 存储 器 。 这 
个 方式 碱 少 了 一 半 访 问 外 存储 器 次 数 ， 同 时 使 得 Houscholder 方 
法 在 内 ,外 存储 器 的 信息 交换 方面 与 Givens 方 靶 一 样 有 效 。 

如 果 我 们 要 Aw,+， 达到 用 内 积累 加 可 能 得 到 的 高 精度 ,那么 
它 的 每 个 元 素 都 必需 要 用 双 精 度 保存 ,而 它 是 在 计算 4, 时 一 个 一 
个 地 产生 的 。 所 以 ,工作 单元 必需 能 接纳 五 个 向 量 , 即 wyqgrywren 
4 和 4i-: 的 当前 一 行 ， 这 一 行 正 要 变换 成 4, 的 一 行 。 因 
为 Aur 暂时 是 双 精 度 形式 ,因此 共 需 要 6n 个 单元 。 如 果 每 次 
内 ,外 存储 器 交换 KK 个 字 , 就 可 以 压缩 为 54 十 改 个 单元 , 因为 我 
们 在 内 存储 器 并 不 同时 需要 4.-， 的 整 行 。 


用 定点 运算 的 Householder 方法 


33, 我 们 在 $29, 530 找 述 的 方法 不 能 直接 在 定点 运算 中 用 .在 
浮 点 运算 中 ，(uwa7) /2K? 有 效 地 分 解 为 形式 s(n712K?)。， 如 果 决 
定 当前 变换 的 元 素 十 分 小 ， 那 么 u,/2K? 的 分 量 将 比 1 大 得 多 。 
Wilkinson〈1960) 提出 了 另 一 种 计算 方案 ,这 方案 中 我 们 用 2(u./ 
2K)(w?12K,) 来 计算 ,在 每 一 次 变换 要 外 加 一 个 平方 根 运算 对 
于 高 阶 和 矩阵 附加 的 平方 根 运 算 的 时 间 与 简化 所 需 的 总 的 计算 时 间 
相 比 是 微不足道 的 ,而 且 在 这 公式 中 很 容易 引进 比例 因子 ， 但是， 
还 有 别 的 方 东 可 以 避免 额外 的 平方 根 运算 ， 这 里 我 们 描述 一 个 这 
样 的 方法 ,首先 是 因为 以 后 的 章节 要 用 到 它 ,其 次 是 因为 其 误差 分 
析 具 有 某 些 富有 启发 性 的 特点 。 

我 们 改 用 引入 比例 因子 的 形式 代替 直接 使 用 向 量 w, 定义 

y= te int {33.1) 
从 (29.5) 和 (29.6) 我 们 得 到 
位 一 0 全 一 1 2 yyr)， 
Jr 一 1，jir nf (arntS) (i=r+2,...,n) 


(33.2) 


和 
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P= 1— Wu/2k 1 — (3 二 gy (33.3) 


现在 如 果 an(i 一 + 十 1 2) 全 都 很 小 , 计算 的 % 将 有 比较 
高 的 相对 误差 ， 尽管 如 此 ， 虽 然 计 算 的 % 与 准确 地 对 应 于 给 定 
的 sw 的 有 实质 性 的 差别 ，”% 的 所 有 分 量 的 模 显 然 不 超过 1、 为 
了 使 得 变换 矩阵 精确 好 正 交 ,我 们 应 该 用 


Po— 29907 ly (33.4) 
代替 (33.3) 的 右边 . 
现在 我 们 可 以 由 下 述 各 式 计算 4,， 
六 一 4 (33.5) 
qr = pr — Cp), yl, (33.6) 
A = A — 29,97 — 2497 (33.7) 


因为 1 < Iy,P 所 2, 在 这 个 计算 方案 的 许多 地 方 必须 引入 比例 因 
子 二 ,但 最 方便 的 做 法 将 在 某 种 程度 上 取决 于 现 有 的 定点 运算 设 
备 ,我 们 不 作 进一步 的 讨论 . 

现在 的 状态 与 我 们 已 经 习惯 的 误差 分 析 情 况 不 同 。 计 算 的 变 
换 托 阵 可 能 与 由 计算 的 4 准确 计算 所 得 的 变 欣 矩阵 有 本 质 的 
差别 . 但 是 这 被 证 明 是 不 重要 的 。 因 为 ya. 一 1， 计算 的 人 中 
相对 误差 小 , 因而 从 〈33.4) 计算 的 矩阵 几乎 准确 地 正 交 ， 此 外 ， 
4,aP 中 应 该 为 零 的 位 置 上 的 元 素 在 运算 精度 意义 下 是 零 。 只 
有 这 些 要 求 我 们 才 必 须 满足 . 


数值 例子 


34. 表 5 的 例子 可 以 充分 地 说 明 上 述 结论 。 例子 是 用 $33 的 
公式 计算 的 ， 决 定 第 一 个 变换 的 4。 的 元 素 非常 小 。 当 不 用 比例 
因 于 时 ，5, 的 计算 值 有 大 的 相对 误差 。 事实 上 , 计算 的 值 是 
0.00005, 而 雇 什 是 0.000053852……。 如 果 我 们 必须 像 (33.3) 那 祥 
结合 一 个 因子 《5, 二 a12)/5, 于 33 的 话 , 那 么 变换 矩阵 甚至 不 
会 近似 地 正 交 。 用 (33.4) 式 ,能 保证 几乎 准确 的 正 交 性 ,同时 把 4, 
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表 5 


0.23157 0.00002 0.00003 0.0000: 
0.00002 0.31457 0.21321 0.31256| 5: 
0.00003 0.21321 6.18175 0.21532| jd 一 131020 
0.00004 0,31256 0.21532 0.41653] iPr/fyrl? = 0.49519 
= C0.00000, 1.00000， 0.42857， 0.57143》 
PI = (0.00004, 0.38707, 0.27423, 0.42568) 
和 一 (0.00004。 一 0.10812， 0.06201， 0.14271) 
A 
0.23157 一 0.00005 0.00000 0.00000 
一 0.00005 。 0.74705 0.18186 0.15071 
0.00000 。 0.18186 0.07545 0.02213| 有 :下 一 1.12997 
0.00000 。 0.15071 0.02213 0.09033] YP ly = 0.08078 
于 一 《0.00000。 0.00900。 1.00000， 0.36051) 
六 一 (0.00000， 0.20903， 0.07383。 0.04840) 
各 一 《0.00000。 0.20903， 一 0.00695。 0.01928) 
二 
0.23157 一 0.00005 9.00000 0,00000: 
一 0.00005 。 0.74705 一 0.23619 0.00000 
0.00000 一 0.23619 0.10325 一 0.01142 
0.00000 。 0.00000 一 0.01142 。 0.06253 
第 一 步 的 畏 确 计算 
3 =0.000053852, yd: = 1.45837, yFp/ ys = 0.50464 
至 一 (0.00000， 1.00000。 9.40622、 0.54162》 
BT = (0.00004, 0.39117, 0.27679, 0,423997 
= C0.00004, 一 0.11347。 0.07180。 0.15567) 
A 
0.23157 —0.00005 0.00000 0.00000- 
0.76845 0.16180 0.12414 
0.06508 0.01107 
0.07927 


的 有 关 元 素 取 为 零 仍 是 完全 丛 当 的 。 但 是 ，4, 与 用 浮 点 运算 和 
530 的 公式 得 到 的 矩阵 很 不 一 祥 。 那 公式 给 出 的 正 交 矩阵 副 近 对 
应 于 4 的 准确 矩阵 。 

在 表 的 末尾 ,我 们 给 出 精确 计算 的 为 和 41， 我 们 看 出 ,为 和 和 
41 两 者 都 有 很 大 的 偏差 ， 
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一 0.00005 


5 二 0.23619 


Householder 方法 的 误 禁 分 析 


35. 现在 已 经 有 Houscholder 方法 的 详细 的 误差 分 析 , 我 们 第 
三 章 $45 的 一 般 性 分 析 只 要 稍 作 修改 就 可 以 概括 对 称 的 情况 。 那 
里 的 (45.5) 式 证 明了 如 果 C 是 用 有 累加 浮 点 运算 并 且 计算 的 三 对 
角 和 矩阵 , R 是 与 计算 的 4, 对 应 的 正 交 箱 阵 的 准确 线 积 ， 那 么 对 某 
常数 K 必定 有 

lc 一 R4oRzlz < 2Kin2 "(1 + K2 7) "lA, (35.1) 
我 们 已 说 明了 在 ACE 上 使 用 浮 点 运算 ，2K， 青 定 小 于 40。 因 
此 ;采用 $26 的 记号 我 们 得 到 


9 
[| 40921420 .2-0zm， (352) 


通常 (35.2) 右边 最 后 一 个 因子 在 这 个 界 的 有 用 范围 内 是 不 重要 
的 .第 一 个 这 样 的 结果 是 Ortega (1963) 得 到 的 , 他 的 证 明 与 我 
们 的 没有 本 质 差 别 。 如 同 第 三 章 545 我 们 指出 的 ， 因 子 22” 用 
孚 不 能 政 善 ,因为 即使 假定 每 一 个 变换 都 准确 执行 , 并 且 所 得 到 的 
和 矩 隆 4r 在 转 入 下 一 步 之 前 合 人 为 七 位 二 进位 ， 我 们 也 得 到 这 样 
的 因子 。 

Ortega 也 得 到 一 个 标准 的 浮 点 计算 相应 的 界 . 用 我 们 的 记号 
表达 ,他 的 界 实质 上 是 


[2 2K (1 + Km)", (35.3) 
: 


常数 K,, K: 依赖 于 具体 的 算术 运算 过 程 。 进行 葛 详 尽 的 分 析 可 
以 使 我 们 已 得 到 的 值 缩 压 一 些 ,但 对 比 (26.2) 和 (35.3) 我 们 可 以 看 
出 ， 用 标准 浮 点 运算 ，Givens 方法 和 Householder 方法 的 界 在 有 
用 的 范围 内 分 别 是 ai2- 和 wz2… 量 级 。 因此 ， 对 于 大 的 m， 
Givens 方法 的 界 比较 好 ， 似 乎 没有 疑问 , 界 (35.3) 比 我 们 已 得 到 
的 大 多 数 界 都 弱 。 但 是 到 目前 为 止 还 没有 确切 的 证 据说 明 万 一 个 
方法 实际 上 给 出 更 糖 确 的 结果 ,困难 在 于 ,因为 舍 人 误差 的 统计 分 
布 ,在 实际 上 我 们 得 到 的 特征 值 十 分 精确 ,要 得 到 这 两 个 方法 的 相 
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对 精度 方面 的 有 用 信息 需要 解 很 大 量 的 高 阶 矩 阵 。 

虽然 , 有 累加 的 用 浮 点 运算 Houscholder 方法 的 上 界 (35.2) 
总 是 十 分 鼓舞 人 的 ,但 经 验 表明 这 是 一 个 严重 的 过 高 估计 ,在 我 们 
详细 研究 过 的 矩阵 中 通常 连 nt2- 的 值 都 没有 达到 。 如 果 采 用 
32 作为 准则 ， 那 么 会 人 误差 的 影响 在 可 预见 的 将 来 显然 不 像 
是 一 个 限制 性 因素 。 例如， :一 40, 一 10:, 那么 od2… 约 为 
10"。 因 此 我 们 可 望 得 到 一 个 最 好 的 结果 ， 


Zu — mls - 
[ 7 ] 一 109. (35.4) 


可 是 ,一 个 10' 阶 的 满 矩阵 有 1 个 元 宗 , 其 简化 包含 二 10” 次 乘 


法 ， 即 使 一 次 乘法 时 间 是 lps, 整 个 简化 过 程 将 需要 200 小 时 . 
Wilkinson 《1962b) 已 给 出 用 有 票 加 的 定点 运算 的 Househol- 
lder 方法 的 详细 误差 分 析 。 这 个 分 析 证 明了 
max [hi ~ pw) < Kn, (35.5) 
这 里 假定 4。 已 被 平衡 使 得 


la < 于 一 Kez22- (35.6) 


这 是 对 每 一 步 有 两 个 平方 根 的 公式 作 的 分 析 ， 但 已 假定 有 内 积累 
加 。 对 一 些 别 的 公式 的 分 析 结果 与 (35.5) 类 做 ,但 是 常数 K, 的 值 
不 同 。 经 验 表明 ,通常 "2-”′ 也 是 过 高 的 估计 。 
对 于 没有 累加 的 定点 运算 , 形 如 
max]2 一 ps) < Kai2 一 (35.7) 
的 界 是 目前 获得 的 最 好 结果 。 


对 称 三 对 角 矩 阵 的 特征 值 

36. 要 完成 Givens 方法 或 Householder 方法 , 我 们 必须 解 对 
称 三 对 角 抑 阵 的 特征 值 问题 。 在 许多 物理 问题 中 ， 三 对 角 和 矩阵 常 
常 是 作为 原始 数据 出 现 的 ， 因 此 它们 本 身 是 很 重要 的 。 这 种 矩阵 
仅 有 《2z 一 1) 个 独立 的 元 案 ， 我 们 可 以 设想 这 个 问题 比 原 矩 阵 
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的 要 简单 得 多 .。 
现在 我 们 考 典 一 个 对 称 三 对 角 和 矩阵 C。 为 方便 起 见 , 我 们 写 
CH a Oy CH = Citis = Bin (36.1) 
如 果 + 个 为 零 ,那么 C 可 以 表示 为 (7 十 1) 个 恢 阶 的 三 对 角 箱 
阵 的 直接 和 .我 们 可 以 写 


CD 
,> (36.2) 


Cot+D 


其 中 Co 是 ms 阶 的 ， 并 且 2mi; 一 a。C 的 特征 值 的 全 体 就 
是 的 全 部 特征 值 ,如 果 * 是 C2 的 特征 向 量 , C 的 对 应 的 特征 向 
量 y 就 是 


YI (0 0.7,0, #7, 0,°°,0), (36.3) 
~ = 
Wh mM We eh Mt 


因此 ,不 失 一 般 性 ,我 们 可 以 假定 没有 一 个 i 是 零 , 并 且 以 后 
都 作 此 假定 . 


Sturm 序列 性 质 


37. 如 果 我 们 用 p.(%) 表示 (C 一 17) 的 + 阶 前 主子 式 , 并 
定义 加 (%) 等 于 1, 我 们 得 到 
名 (1 一 四 一 1 (37.1) 
Pi(2) = (0 — pet) — Ppia 1) i = 2 《37.2) 
2(2) 的 零点 是 C 的 7 阶 前 主子 矩阵 的 特征 值 ,因此 都 是 实 的 . 我 
们 用 C, 表示 这 子 和 矩阵 . 
现在 我 们 知道 ， 每 个 C。 和 Cr+ 的 特征 值 至 少 是 在 弱 意义 
下 互相 分 隔 (第 二 章 $47)。 我 们 证 明 , 如 果 没 有 一 个 Bi 是 零 , 那 
么 分 隔 是 严格 的 。 事 实 上 , 如 果 关 是 p,(1) 和 P,-:(4) 的 一 个 零 
点 ,那么 对 于 i 一?, 从 (37.2) 以 及 p, 不 是 堆 可 知 , rr 也 是 p,-a(4) 
的 一 个 零点 。 因 此 ,对 于 i 一 + -一 1, 从 (37.2) 可 知 , 它 也 是 p,-:(4) 
的 零点 。 继 续 递 推 下 去 ， 我 们 得 知 * 是 如 (4) 的 一 个 办 点, 但 是 
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与 am(1) 一 工 产 生 了 矛盾 。 

由 此 我 们 归纳 为 ， 如 果 一 个 对 称 第 阵 有 午 数 为 & 的 特征 值 
那么 准确 实现 Givens 方法 或 Houscholder 方法 得 到 的 三 对 角 矩 
降 必 定 罕 少 有 (# 一 1) 个 上 对 角 线 元 素 是 堆 ， 另 一 方面 ,在 Gviens 
或 Houscholder 三 对 角 型 中 上 对 角 线 出 现 专 元素 不 一 宣 意 味 着 有 
重 根 ， 

38. 上 对 角 线 元 素 都 不 是 志 的 对 称 三 对 角 矩 阵 的 夫 点 严格 分 
隅 形成 了 确定 特征 值 的 最 有 效 方法 的 一 个 基础 《Givens，1954?， 
首先 我 们 证 明 下 述 结论 ， 

假设 量 ai(m ,Cp), Ca 是 对 其 个 * 什 的 计算 信 ， 屠 


A 

为 了 上 面 的 论述 对 所 有 的 < 值 都 有 意义 ， 我 们 必须 规定 ， 当 
Pr(p) 是 零 时 将 取 什 么 符号 。 如 果 PC) 一 0， 我 们 令 它 的 符号 
与 pia(p) 的 符号 相反 【注意 ,不 会 有 两 个 相 邻 的 p(n) 都 是 
零 ]. 

我 们 用 归纳 法 证 明 ， 假 定 序列 总 (pa) ,pp) pp) 中 的 
向 号 数 * 是 5, 的 大 于 “的 特征 值 个 数 ( 即 (1)》 的 零点 数 )， 然 
后 我 们 用 = a,"…", zxr 表示 C, 的 特征 值 , 这 里 

> 和 38.1) 
因为 没有 一 个 B 是 零 ， 也 就 没有 重 特征 值 ， 现 在 Cot， 的 特征 值 
为, ht 与 C; 的 特征 值 在 严格 的 意义 下 互相 分 隔 ， 因 此 

bi 

> Jy > > yn (38.2) 

这 表明 Cs 有 :个 或 :十 1 个 特征 信 大 于 px， 显 然 ,我 们 有 


pl) = TT Gp pp) = TO — .38.3) 
t=1 tl 


如 果 x 或 % 都 不 等 于 pn， 那 么 我 们 立刻 就 得 到 结果 ， 因为 在 
这 种 情况 下 ， 如 果 ys > #， 那么 pCp) 和 pnts(p) 符号 相同 。 
因此 ,在 这 扩充 的 序列 中 , 同 号 数 多 了 一 个 。 然 而 :如 果 Yin < py 


.3l2. 


一 一 a-(4) 的 零点 
(0 的 零点 
TR 
Pri《4) 的 零点 


那么 pp) 和 各 ha(A) 符号 不 同 ， 这 使 得 扩充 的 序列 与 原 序列 
的 同 号 数 相等 。 对 于 这 两 种 情况 ,我 们 都 证 明了 我 们 的 结论 。 

如 果 yo 一 po 我 们 令 pn(p) 的 符号 与 p(n) 的 相反 (在 
这 情况 下 p(x) 不 会 是 零 )， 这 使 得 扩充 后 的 序列 具有 相等 的 局 . 
号 数 , 它 等 于 严格 大 于 4 的 特征 值 个 数 。 

如 果 zi 一 我们 以 + 一 5，s 一 2 的 情况 作为 例子 在 图 
中 表示 出 来 、 我 们 取 p(n) 为 零 时 的 符号 与 ,i(4) 的 相反 从 
Pea(4)，pr(X) 和 nn(4) 的 零点 严格 分 隔 得 出 ， 与 8.4) 相 
比 ，Pra(X) 必定 多 一 个 零点 大 于 jp， 多 一 个 零点 小 于 p。 因 此 ， 
Pona(p) 必定 与 Pr) 的 符号 相反 ,于 是 pulp) 与 pp 的 
符号 相同 。 增多 了 一 个 同 号 数 正好 表明 增加 了 一 个 大 于 的 等 
点 。 

读者 应 该 确信 ,假若 我 们 只 对 C 的 特征 值 感 兴趣 ,那么 pp) 
;一 1 一 1) 的 信和 是 零 时 ， 它 的 符号 是 不 重要 的 .我 们 仅 
需 对 pr(n) 使 用 严格 的 规则 . 

我 们 可 以 说 多 项 式 pa(2),p(2)， pu(1) 有 Sturm 序列 性 
质 . 


分 半 法 


39，Strm 序列 性 质 可 用 于 确定 任 一 个 特征 值 ,比如 说 , 按 递 
踪 顺 序 第 和 个 ,而 不 必 人 参考 其 他 任何 一 个 ,假定 我 们 有 两 个 值 w 和 
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包 使 得 

名 > 49，s(40) 六 (Bo) 到 天 (39.1) 
由 此 可 知 ht 藩 在 区 间 (ao, 5) 内 。 然后 我 们 用 ? 步 选 代 可 以 
使 确定 在 宽度 为 5 一 oo)/2? 的 区 闻 (ap,6p) 肉 * 其 中 第 了 
步 如 下 : 令 


cr 一 十 (Cars TT Bei) 


是 (4,4,51-1) 的 中 点 ,然后 计算 序列 
Pol cs), pic) ,Paler), 
再 计算 sles), 
如 果 以 cr) 汪 率 那么 取 oar = br 一 
如 果 s(c,) 过 《那么 取 a 一 as 部 一 cr 
无 论 是 鄂 一 种 情况 ,我 们 都 有 
gv) 送 和 s(51) 一 和 (39.2) 
因此 4 落 在 区 间 (si, 少 ) 之 内 ， ms 的 适当 的 值 是 + 上 Cl。， 
并 且 我 们 有 1 Cll- 一 mextip8 士 ll 十 lB8inl}。 


分 半 法 的 数值 稳定 性 


40. 用 准确 计算 实现 $39 的 方法 可 以 确定 任 一 个 特征 值 达 到 
任何 精度 。 在 实际 计算 中 舍 人 误差 限制 了 可 能 达到 的 精度 ， 但 是 
尽管 有 金 人 误差 影响 ， 这 方法 正如 我 们 要 证明 的 那样 是 十 分 稳定 
的 ， 现 在 我 们 给 出 标准 浮 点 运算 的 误差 分 析 ， 

首先 我 们 证 明 对 任何 4 和 值 ,序列 po(p), pz) pn) 的 
计算 值 是 元 素 为 mw 十 so，p 十 58: 的 修正 三 对 角 和 矩阵 对 应 的 准 
确 值 , 其 中 smw，566: 满足 关系 


18w| < (3.01)27 Cle} + 121), 
\a8:| < (1.51)27( |8.|). 
我 们 用 归纳 法 证 明 。 首 先 假 定 计算 的 
Palp)s Pip) se poi) 


(40.1) 
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是 元 素 为 % 十 60i,B; 十 si 一 12 一 1) 的 修正 矩阵 对 
应 的 准确 值 , 然后 证 明 计算 的 p,(x) 是 一 个 + 阶 修正 矩阵 对 应 的 
准确 值 ,这 个 矩阵 的 前 > 一 1 行 和 7 一 工 阶 的 修正 矩阵 相同 ,第 > 
行 的 修正 元 素 是 a 十 scr，p, 十 86,。 对 于 计算 值 p(y) 我 们 有 
pAp) 一 有 [Co 一 pp p) — Pp 1)1} 
二 (cr 一 ap KAI 二 Bi) — Pipea pl + 82), 
(40.2) 
这 里 ,从 通常 的 不 等 式 有 
(2 Ele t2 yp (=1,2), (40.3) 
因此 ,我 们 不 必修 改 前 面 的 元 素 oi 十 sm， B: 十 38; 就 可 以 验证 ， 
计算 的 p.(p) 确 是 对 应 + 阶 修正 矩阵 的 一 个 准确 值 。 我 们 只 须 
取 


wrt Bm — p= (0, — p)(l + 1)s (40.4) 
(8, + 88,) = Bl + 52). (40.5) 
这 必定 得 出 
lo < (3.01)2 (10 + Hal), (40.6) 
{88,| < (1.51)2™"|p,!, (40.7) 


因为 当 + 一 1 时 结论 显然 是 对 的 ， 至 此 我 们 的 结果 已 建立 了 , 注 
意 ,(40.7) 表 上 明 ,如 果 8, 不 是 零 ,那么 pr 十 38, 也 不 是 零 , 因 此 摄 
动 后 的 矩阵 的 特征 值 也 各 不 相同 . 
我 们 可 以 用 〈C 十 5Cx) 表示 摄 动 后 的 三 对 角 和 矩阵 ， 我 们 用 
了 下 标 4 是 要 着 重 指明 5C 是 上 的 函数 . 因此 ， 计 算 的 序列 的 
相 邻 项 同 号 数 是 〈C 十 5Cx) 的 大 于 4 的 零点 个 数 。 
41. 为 方便 起 见 ,我 们 假定 ws 和 PB: 满足 关系 
ll, lel 1, (41.1) 
又 假定 像 $39 那样 ,分 半 法 中 使 用 的 所 有 的 上 值 均 落 在 区 间 ( 一 3， 
3) 内 ， 因 此 ,对 任何 * 值 我 们 有 
18ar| < (12.04)2™", 188,| < (1.51)2™. (41.2) 
矩阵 8C。 是 一 致 有 界 的 ,用 无 穷 范 数 ,我 们 看 出 (5 十 8Co)* 的 


* 原文 误 为 5C。. 一 一 洋 者 注 
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特征 值 总 落 在 以 C 的 特征 值 1; 为 中 心 ,宽度 为 
2[12.04 十 2(1.51)12 一 一 (30.12)2 一 一 24 (41.3) 
的 区 闻 内 . 

在 计算 第 个 特征 值 时 ， 对 于 分 半 法 的 每 一 步 我 们 必须 回答 
的 一 个 重要 问题 是 ，“C 的 大 于 当前 区 关中 心 , 的 特征 值 是 否 少 
于 个 ? .” 如 果 每 次 都 能 正确 地 回答 。 那 么 , 44 总 属于 一 个 正确 
-的 区 间 。 不 管 实际 得 到 的 同 号 数 是 否 正 确 ,这 个 结论 都 是 对 的 ， 

现在 我 们 证 明 ,如 果 “, 是 在 以 4 为 中 心 ,宽度 为 《41.3) 的 
区 间 之 外 ,我 们 必定 得 到 正确 的 答案 , 也许 还 有 靠近 的 特征 值 甚至 
C 的 某 些 别 的 特征 值 也 落 在 4 区 间 内 。 事实 上 ， 如 果 c, 小 于 
及 一 4， 那么 (5 十 8C。) 的 前 & 个 特征 值 必 定 大 于 c,。 而且 可 
能 有 和 更 多 的 特征 值 大 于 “<"， 计 算 的 序列 给 出 《5 十 5Ca) 的 序列 
的 正确 同 号 数 ,因此 它 必定 用 “ 否 ” 来 正确 地 回答 我 们 的 问题 ,即使 
实际 得 到 的 同 号 数 有 错 也 无 关 要 紧 。 类 似 地 , 如 果 <- 大 于 十 
#4, 那么 当然 (C + 8Ce) 的 第 个 特征 值 和 所 有 更 小 的 特征 值 必 
定 小 于 c+。 因 此 ,我 们 必定 得 到 问题 的 正确 答案 “是 ”。 

这 个 过 程 是 这 样 进行 的 : 或 者 是 (i) 每 次 都 得 到 正确 的 答案 ， 
此 时 4 蓝 在 每 个 区 间 (ar,5) 内 ;或 者 是 (ii) 在 某 一 步 给 出 了 错 
误 的 加 答 。 除 非 <, 属于 办 区 启 这 种 情况 才 会 发 生 .〈 注 意 ,， 对 
于 在 ak 区 向 内 的 c, 前 面 可 能 给 出 过 正确 答案 .) ”现在 , 我 们 
证 明 在 这 种 情况 下 〈c 在 4 区 间 )， 以 后 所 有 的 区 闻 (a1,5;) 
至 少 有 一 个 端点 属于 Mk 区 间 . 

假设 对 于 《erropr) 论断 正确 。 如 果 两 端 金 落 在 4 区间 
内 , 那么 显然 以 后 所 有 41, & 全 都 在 该 区 间 内 ， 如 果 只 有 一 端 比 
如 说 br 在 该 区 间 内 ， 那 么 b+: 必定 是 作出 不 正确 的 判定 的 那 
一 点 。 这 种 情况 可 用 图 2 说 明 . 

如 果 {awasBrr) 的 中 点 “ro 是 在 该 区 间 内 ， 那 么 不 管 判定 
是 否 正确 ，“b 是 〔arra， bb) 的 一 个 端点 。 若 cr 在 该 区 间 
外 ,那么 对 于 “rn 我 们 作出 的 判定 正确 并 且 得 到 5 一 bm。 因 
此 ,在 任何 一 种 情况 下 ,至 少 有 《sa， 姑 mp) 的 一 个 端点 在 该 区 间 
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内 。 继 续 这 样 论证 就 能 证 明 我 们 的 结果 。 
如 果 我 们 在 第 8 步 停止 ,最 后 的 区 间 (sp,6r) 的 中 心 con 满 
足 不 等 式 ; 
Lert — di < (15.06)27 + (bo 一 加)272 


< (15.06)2 一 十 3 了 279. (41.4) 
Oe 和 一 
aa br Ax 
图 2 


数值 例子 


42. 在 表 56 中 我 们 说 明 用 Sturm 序列 性 质 确定 5 阶 三 对 角 矩 
阵 的 第 三 个 特征 值 ， 我 们 用 4 位 十 进位 ， 学 点 运算 矩阵 的 无 穷 
范 数 小 于 1.7, 因 此 所 有 特征 值 都 属于 区 间 (一 1.7, 1.7)。 所 以 ,第 
一 个 分 半点 是 零 。 对 于 这 点 有 3 个 同 号 数 ,这 表明 % 在 区 间 (0， 
1.7) 内 ， 


表 6 

i 0 1 2 

Li 一 0.2165 0.3t23 

Bs 一 一 0.7163 
piC0.0000) 1.0000 10C0.2165) —10C0,.6487) 
pi(0.8500) 1.0000 一 108C0.63537 一 10K0,37577 
pC0.4250) 1.0000 一 10%(0.2085》 —1mC0.6928) 

3 4 5 

a 0.4173 0.4431 0.6124 

a? 0.3125 0.2014 0.5016 
pCO.0000) —1%(C0.3385) —107"C0.1934) I0%0.1579) 7 =3 
jpiC0.8500) 10°C0.3605) 一 10-((0.7102》 | —10°%0,1610)s =2 
PiC0.4250) 107100.7035) OC0.1408) | —10-*C0.8902) + 一 2 
第 二 个 分 半点 是 0.85，Sturm 序列 有 2 个 局 号 数 ,这 说 明 2 在 区 


闻 (0,0.85) 内 ， 第 三 个 分 点 是 0.425, 并 给 出 2 个 同 号 数 ， 因 此 ， 
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心 在 0 与 0.425 之 问 。 值 得 注意 的 是 ,我 们 也 得 到 了 下 述 信 息 : 
2 和 4 在 一 17 和 0 之 间 ， 
和 和 在 085 和 1.7 之 间 ， 


关于 分 半 法 的 总 评述 


43. 如 果 我 们 执行 分 半 法 上 步 ,从 (41.4) 得 到 第 个 计算 特征 
值 的 误差 界 是 (18,06) 2 根据 分 析 ， 它 显然 是 过 高 的 估计 。 最 
值得 重视 的 是 这 个 结果 与 5 无关。 

在 每 个 序列 如 , P,，……-, Po 的 计算 中 有 24 个 乘法 和 24 个 减 
法 《好 可 以 一 次 计算 )。 因 此 , 如 果 用 * 步 独立 地 寻找 全 部 = 个 特 
征 值 , 要 2w: 个 乘法 和 减法 ， 对 于 大 的 x。 需要 的 次 数 是 下 数量 
级 , 而 执行 Givens 或 Householder 简化 是 于 数量级。 所 以 对 于 
充分 大 的 x。 特 征 值 的 计算 量 比 简化 过 程 的 小 .但 是 由 于 有 因子 
24, 对 于 # 在 100 以 上 , 上述 结论 才 成 立 ， 实际 上 要 计算 大 矩阵 的 
全 部 特征 值 是 不 多 见 的 ， 

分 半 法 运算 的 时 间 与 特征 值 的 分 离 程度 无 关 ， 并 且 正 如 我 们 
已 证 明 的 ， 精 度 不 受 它们 的 密集 性 影响 。 我 们 不 强迫 自己 全 过 程 
都 用 分 半 法 , 当 一 个 特征 全 被 孤立 在 一 个 区 间 内 的 时 候 , 我 们 可 以 
转 用 渐 近 二 次 或 三 次 收敛 的 其 他 选 代 方法 ， 这 些 方法 我 们 将 在 第 
七 章 讨论 ,但 是 如 果 有 很 多 靠近 的 特征 值 ,那么 转 用 别 的 方法 收益 
甚 徽 。 对 于 单 特征 值 二 次 收敛 或 三 次 收敛 的 方法 通常 对 于 重 特征 
值 仅仅 是 线性 收敛 因此, 如果 有 极其 靠近 的 特征 值 ( 不 可 能 有 真 
的 重 特征 值 ， 因为 8 都 不 是 零 )， 二 次 收敛 ,或 三 次 收 化 性 可 能 不 
会 发 生 , 这样 的 方法 可 能 比分 半 方 法 更 慢 . 

分 半 方法 有 极 大 的 灵活 性 。 我 们 可 以 用 来 寻找 专门 挑选 的 特 
征 值 ,4m,"…, 4 或 者 在 一 个 给 定 的 区 闻 (x,Y) 内 的 特征 
值 ， 或 者 给 定 值 的 左边 或 右边 的 几 个 特征 值 。 我 们 不 要 求 所 有 的 
特征 值 的 糖度 一 样 ， 那 么 只 要 改变 分 半 步 数 就 能 非常 简单 地 达到 
这 ~- 且 的 。 如 果 只 想 了 解 特 征 值 的 一 般 分 布 情况 ， 而 不 要 求 精确 
的 值 ， 那 么 这 方法 是 特别 有 效 的 . Dean 〈1960) 曾 用 它 给 出 阶 数 
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高 达 32000 的 三 对 角 和 矩阵 的 特征 值 分 布 . 

我 们 已 研究 了 如 何 单独 地 确定 每 一 个 特征 值 。 但是。 因为 每 
计算 一 次 Sturm 序列 我 们 都 得 到 信息 : ”在 计算 点 右边 有 多 少 特 
征 值 ,我 们 可 以 同时 寻找 金 部 特征 值 。 如 果 有 密集 的 特征 值 群 那 
么 收益 是 十 分 可 观 的 。Givens (1954) 在 他 的 原著 中 找 述 了 Sturm 
序列 性 质 的 这 种 特殊 应 用 。 


小 特征 值 


44. 注意 ,我 们 不 要 求 确定 小 的 特征 值 的 相对 误差 小 ， 我 们 用 
一 个 简单 的 例子 来 表明 为 什么 一 般 不 能 这 样 要 求 . 考 坊 = 阶 矩 阵 

oi (il nn) B= = 1 Oo 1). (44.1) 
和 矩阵 的 特征 值 是 
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如 果 # 大 ,最 小 的 特征 值 就 比 1 小 得 多 ， 现 在， 对 任何 代 # 计 算 
Strum 序列 ,有 
Pp) 一 《or 一 站 -一 全 pr， (44.2) 

因子 mw 一 上 是 2 一 上 作为 例子 ， 假 定 用 6 位 十 进位 浮 点 运算 ， 
并 且 取 x 一 10 (0.213456)， 那 么 , 对 于 2 一 上 我 们 得 到 
10:(0.199979), 5 的 最 后 4 位 被 完全 怨 略 了 ， 因 此 , 计算 的 Strum 
序列 对 上 在 10-(0.205) 和 107(0.215) 之 间 的 所 有 值 是 一 样 的 , 
我 们 对 于 象 这 样 小 的 特征 值 不 可 能 获得 许多 位 有 效 字数 . 

尽管 有 这 个 警告 ,人 们 还 是 时 常 效 得 小 的 特征 值 ,其 相对 误差 
小 得 惊人 ,要 解释 这 个 现象 需要 特殊 的 误差 分 析 . 


靠近 的 特征 值 和 小 Pp; 

45. 我 们 业已 看 到 ($37), 如 果 三 对 角 算 阵 的 Pi 全 不 是 零 , 它 的 
特征 值 必 然 是 单 重 的 。 人 们 可 以 认为 ， 一 个 矩阵 如 果 有 一 些 特征 
值 非常 靠近 ， 它 必定 至 少 有 一 个 “很 小 "的 p;， 但 这 种 想法 是 不 对 
的 。 我 们 能 够 证 明 ,如 果 C 是 规范 化 的 三 对 角 和 矩阵 ,其 特征 值 之 闻 
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最 小 的 距离 是 8， 那 么 ,对 十 固定 的 ", 当 8 0 时 ，maxfr 一 0。 
但 是 ,我 们 可 以 构造 一 个 阶 数 适中 的 盾 阵 ， 它 的 特征 值 非常 靠近 ， 
但 是 所 不 小 。 
现在 我 们 引信 两 类 三 对 角 和 矩阵 ，W 声 ,， 和 W 吉 3+。 它们 在 后 
面 也 很 有 用 处 。 我 们 用 下 述 关系 定义 多 起 ， 
ont1l—i(im1,.n Tt 1), 
win lmt .25 t+ 1), (45.1) 
B=1 (i=2,.,22+ 1). 
用 下 述 关 系 定 义 Wis+t， 
or= nt loi(ie1,. 二 1), 
wt li lint2, .2+ 1), (45.2) 
局 一 1 G=2,.,27 +t 1). 


例如 
2 1 
1 1 1 
Wi 一 1 0 1 ， 
1 1 1 
1 2 
2 1 
1 1 1 
Wi 一 1 0 1 . (45.3) 
i~1 1 
1—2 


在 表 7 中, 我们 给 出 WW 去 和 Ww5 的 特征 值 , 有 七 位 十 进位 ， 
和 矩阵 了 去 有 一 些 特 征 值 对 ,它们 非常 带 近 ， 事 实 上 , 与 4 有 
15 位 十 进位 相同 ，2 与 1 有 11 位 十 进位 相同 ,其 它 的 对 的 距离 
逐渐 拉 大 。 对 于 大 的 *， 这 种 现象 变 得 更 明显 ， 我 们 可 以 证 明 
4 一 加 大 致 是 (1 数量 级 。 众 所 周知 ， 矩 阵 丈 寺 不 是 规范 


化 的 ,但 是 | 二 对 几 一 1 因此 ， 在 规范 化 之 后 我 们 得 到 所 一 
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1711 ,并且 没有 一 个 fi 可 以 认为 是 病态 地 小 的 。 注 意 ，Wi 的 一 
些 大 的 特征 值 与 W 的 很 靠近 ， 对 于 大 的 # 它 们 舍得 更 近 。 Wa 
的 特征 值 以 大 小 相等 符号 相反 成 对 出 现 ， 我 们 不 难 证 明 对 一 般 的 
了 is: 也 是 这 样 。 


表 7 

Wh 的 特征 什 Ws 的 特征 信 
10.74619 42 5.00024 44 二 10.74619 42 
10.746I9 42 4.99978 25 土 9.21067 86 
9-21067 B6 4.00435 40 士 8.03894 11 
9.21067 86 3.99604 82 士 7.00395 20 
8.03894 1I 3.043 的 93 土 6.00022 57 
8.03894 11 2.96105 89 士 5.00000 82 
7.00395 22 2.13020 92 土 4.0000 02 
7.08395 18 1.78932 14 土 3.00000 00 
6.00023 40 0.94753 44 土 2.00000 00 
6.00021 75 0.25380 58 主 1.00000 00 
一 1.12544 15 0.00000 00 


矩阵 瑟 吉 +: 的 特征 向 量 可 以 通过 对 两 个 矩阵 Vs+， 和 7 的 
计算 而 间接 确定 。 这 两 个 矩阵 的 特征 值 的 分 离 较 好 ,为 简单 起 见 ， 
我 们 用 ”~ 3 的 情况 来 说 明 这 个 简化 过 程 ， 一 般 的 情况 从 此 可 以 
容易 地 得 出 。 我 们 写 出 


3 1 


(45.4) 


1 


现在 如 果 ” 是 U, 的 对 应 于 特征 值 1 的 一 个 特征 向 萎 , 显然 4 是 
W# 的 一 个 特征 值 ,其 对 应 的 特征 向 量 瑟 , 给 定 为 

Ww = (Wis Ws Hay Ws Hys Has 2 (45.5) 
这 向 量 是 关于 中 间 的 元 素 对 称 的 。 另 一 方面 ， 如 果 sv 是 对 应 于 特 
征 值 < 的 局 的 特征 向 量 , 那 么 上 是 W# 的 一 个 特征 值 ， 对 应 的 特 
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征 向 量 ws 给 定 为 
wi(v1, ms os 0， 


这 向 量 是 关于 中 间 的 元 素 反对 称 


一 2 一 2 一 2， 


的 ， 


(45.6) 


机 志 +: 的 特征 值 因此 就 是 Vor 和 VV。 的 特征 信 , 并 且 Usts 
和 V。 的 特征 值 都 是 明显 分 离 的 .对 2 一 10, Zu 和 Yo 的 最 大 


特征 信 分 别 是 
10.74619 41829 0339.… 和 10.74619 41829 0332…， 
在 表 8 中 我 们 给 出 Da 各 Yu 的 对 应 的 特征 向 量 。 三 支 对 应 的 
表 8 
四 o 

1,00000 00000 1.00000 00000 
0.74619 41829 0.74619 41829 
0.30299 99415 0.39299 99415 
0.08590 24939 0.08590 24939 
0.01880 74813 0.91880 74813 
0.00336 14646 0.00336 14646 
0.00050 81471 0.00050 B1471 
0.00006 65944 0.00006 65942 
0.00000 77063 0.00000 77045 
0.00000 08061 0.00000 07905 


0.00000 01500 


特征 向 量 w, 和 ww 是 像 我 们 上 面 讨论 的 那样 构造 出 来 的 .注意 ， 


(we 十 wy) 的 下 半 部 分 几乎 是 零 , 而 〈i 一 wz) 的 上 


零 ， 向量 w: 和 w 的 分 量 有 明 


显 的 极 小 值 。 


部 几乎 是 


值得 重视 的 是 ， 每 当 三 对 角 甜 阵 C 的 一 个 特征 向 量 在 区 间 的 
谐 点 有 很 明显 的 极 小 值 ,那么 C 必定 有 十 分 靠近 的 特征 值 。 例如， 


假定 一 个 规范 化 的 17 阶 甜 阵 ， 其 特征 值 4 对 上 


ws 它 的 分 量 的 对 数 约 为 
(0,—1,—4,—8,—12,12, 


应 于 一 个 特征 向 最 


—12,—8,—3,—1,0), 
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$,—3,0,—2, 


8, 


11, 


现在 我 们 考虑 定义 如 下 的 三 个 向 量 wi， wss ws 


wi 一 《xy hs #9 0 -0)， {45.7) 
wi = (0, eo, D0, tys Has 的 xy tus 0 +s 0), (45.3) 
wi = (0,+ ,0s ts Hiss ao or (45.9) 


剩余 向 量 (Cwi 一 4wi) 都 有 分 量 , 或 者 是 零 ， 或 者 是 10-* 数量 
级 ,这 一 事实 从 C 的 三 对 和 角 型 特性 立刻 可 得 .因此 ,三 个 正 交 向 量 
wi ws ww 对 应 特征 值 4 的 剩余 都 十 分 小 ， 并 且 几 乎 是 三 重 的 特 
征 入 (第 三 章 $57). 

46. 当 原来 的 三 对 角 和 矩阵 有 某 些 8 是 零 , 我 们 兽 建议 把 它 看 
作 一 些 较 小 的 三 对 和 角 答 阵 的 直接 和 。 现在 假定 ， 我 们 把 所 有 惟 B 
换 为 (一 个 小 量 )， 用 所 得 到 的 矩阵 〔C 十 5C) 代替 C 进行 运 
算 ,矩阵 5C 是 对 称 的 ,并 且 所 有 8C 的 特征 值 1 满足 

4 < 15cll。 一 2 (46.1) 
因此 ,(C 十 5C) 的 特征 值 各 不 相同 ,并 且 落 在 以 C 的 特征 值 为 中 
心 的 宽度 为 4 的 区 间 内 。 如 果 C 的 元 素 的 模 以 1 为 界 ， 我 们 令 
8 一 2 后 ， 那 么 由 s 元 素 相 加 所 产生 的 误差 显然 是 十 分 微小 的 。 

因为 没有 零 非 对 角 线 元 素 ,我 们 没有 必 讲 把 (C 十 8C) 分 为 
较 小 的 子 矩 阵 。 这 个 修改 对 于 程序 的 简化 是 有 益 的 ， 但 是 显然 要 
多 费 计算 时 间 。 不 过 , C 作为 一 个 整体 来 处 理 有 一 定好 处 ,我 们 可 
以 找 指定 的 某 一 个 (比如 说 ,第 7 个) 特征 信 , 而 不 必 分 别处 理 几 个 
小 矩阵 ， 

如 果 我 们 着 重 于 节省 计算 机 时 间 ， 我 们 可 以 反 过 来 作 . 在 C 
中 所 有 小 的 Bi 都 用 零 来 代替 ,得 到 的 拢 隆 (C 十 5C) 划分 为 若 
干 个 子 和 矩阵 ， 如 果 我 们 删除 所 有 满足 

481 <e (46.2) 
的 名 ,那么 与 上 一 段 相 同 的 论证 可 得 :在 每 一 个 特征 慎 上 产生 的 
最 大 误差 是 28*， 现 在 我 们 证 明 , 在 任 一 个 与 其 他 特征 值 明显 分 离 
的 特征 值 上 产生 的 误差 远 小 于 28， 

为 了 简化 记号 ,假定 只 有 p* 和 pv 满足 关系 (46.2)。 并 以 三 
个 三 对 角 矩 阵 的 直接 和 【〔C 十 8C) 来 作 讨论 。 记 
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假定 Cox 一 px, 见 8 是 C3 的 一 个 特征 值 , 因此 也 就 是 《C 十 
5C) 的 特征 值 ， 如 果 记 


呆 一 (ar0 0 080.0, 0) (46.4) 
这 里 v7 的 划分 与 C 的 一 致 。 定 义 9 为 
Co — py = (46.5) 


则 有 
WT (0088zop-o0 1030,0 0)。、 (46.6) 
因此 ,? 与” 亚 交 , 且 “ 是 C 的 关于 ”的 Rayleigh 商 (第 三 章 454)。 
假定 ” 是 规范 化 的 ,显然 我 们 有 
Im 小 < 6. (46.7) 
因此 ,由 第 三 章 555, 我 们 得 到 :如 果 C 的 特征 值 除了 其 中 的 一 个 
以 外 与 疡 的 距离 都 大 于 a, 那么 有 一 个 的 特征 值 1 满足 


a 82 

[| <s/(1-5). {46.8) 

例如 ， 如 果 我 们 知道 特征 值 的 最 小 距离 是 10”， 我 们 运算 用 的 是 
19 个 十 进位 ,那么 所 有 满足 不 等 式 

上 人 <10™% (46.9) 


的 忆 都 可 以 用 零 来 代替 。 
等 征 值 的 定点 计算 


47. 对 于 分 半 法 ，(837 ~ 4$39) 浮 点 运算 是 很 重要 的 ， 如 果 用 
定点 运算 ， 计 算 中 要 引进 许多 的 比例 因 了 于， 结果 计算 实际 上 比 浮 
点 更 复杂 。 然而, 因为 基本 的 要 求 是 对 # 信 计算 (C 一 上) 的 前 
主子 式 , 我们 可 以 使 用 第 四 章 549 描述 的 方法 ， 因 为 (C 一 g1) 
是 三 对 角 型 ,我 们 发 现 这 个 方法 与 部 分 主 元 素 Gaus 消去 法 相同 ， 
我 们 后 面 研究 特征 高 量 问 题 时 也 要 用 到 这 个 方法 。 我 们 详细 叙述 
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它 . 这 个 过 程 有 # 一 ! 步 ,在 第 + 步 开 始 的 时 候 , 第 + 十 1，* 十 
2,……，= 行 都 未 修改 过 。 例 如 一 6，r 一 3, 这 一 步 开 始 时 矩阵 
的 形式 为 : 


Le 3 2 Wy 
各 名 多 。 (47.0) 
B 四 一 P bs 
Ea os—p PB 


Bb 一 
下 面 我 们 叙述 第 " 步 。 有 关 的 记号 将 会 明确 . 
人 车 18 > p, 则 交换 第 7 行 与 第 + 十 1 行 . 用 ww，or 
w, 表示 所 得 的 第 ? 行 元 素 ， 用 xr+i，y+t， ar 表示 所 得 的 第 ” 
十 工行 元 素 。 于 是 ,如 果 执 行 了 交换 ,我 们 就 有 
Wr bri Vr Ort py We Berns tems = Pry 


rt 一 ga 


否则 ， 
We pr tr gs Wr 0 t= Bets 
Yr 一 of ps Sep ™ Brrae 
现在 ,对 应 (47.1) 的 形状 为 
Wy VL 
1 Wm Va Wy 
ms 网 全 ， (47.2) 


x 2 


Bs mp 
其 中 ws 或 #。 为 零 。 
(ii) 计算 mw … xr/fu, 并 加 以 存储 。 用 替代 替 ze 
(四 》 计算 Pre 一 yea 一 mhipr rh 一 Zhi 一 各 mawry 并 分 
列 耶 盖 在 ywrozrr: 上 。 
现在 矩阵 形状 为 
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tm th 0 
Ee Wa Vs Wy 
p,q " {47.3) 
Bb ws—p fe 
a Ge 一 民 


注意 ， 户 一 上 一 pz。 4 一色 。 简 单 的 归纳 证 明 : 如 果 C 被 平衡 使 
得 


1 
te 8 < 5， 


那么 对 所 有 许可 的 值 w* 在 约 化 过 程 中 产生 的 元 素 都 以 ! 为 界 .这 

样 ， 定 点 计算 是 很 方便 的 。 为 了 着 重 说 明 这 方法 实际 上 是 Gauss 

消去 法 , 我 们 已 显示 《C 一 pI) 的 形状 。 以 及 逐次 的 约 化 的 满 答 

降 。 但 是 实际 上 ,我 们 当然 要 利用 三 对 角 型 的 特点 ,只 需要 用 一 继 

数组 存 情 wyw， mi。 如 果 我 们 存储 了 mi wi, vi, w; 并 记 住 在 计 

算 mm 之 前 是 否 作 过 交换 ,我 们 可 以 接着 处 理 方程 
(Cpl)xr=6 


的 右 端 。 

第 "个 主子 式 & 是 (一 1 )tut arttps 其 中 志 是 直到 《7 
一 1) 步 作 完 时 执行 交换 的 总 次 数 。 当然， 我 们 不 必 形 成 这 个 科 
积 ,我 们 仅 需 记 录 它 的 符号 .因为 我 们 有 

jd = (— ep upon (— trum -art 
= (— Dirrtwpr/ pr. (47.4) 
我 们 看 出 ,如 果 (47.4) 的 右边 是 正 的 ,2x: 与 a 的 符号 相同 , 亦 即 
得 到 一 个 同 号 。 

要 进行 类 似 于 $41 那样 的 误差 分 析 是 不 可 能 的 。 交 换 的 结果 
使 得 原 矩 阵 的 等 价 报 动 可 能 是 非 对 称 的 。 例 如 ， 如 果 每 一 步 都 执 
行 了 交换 ， 那 么 正确 地 给 出 计算 乘 子 和 主 元 行 的 矩阵 是 如 下 的 形 
式 
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十 8 肋 十 8 BE，8， 6, 
La eo] 名 
BB mh (47.5) 
Bb a Bs 
PB 四 


所 有 的 摄 动 都 是 在 第 1 行 。 另 外 ， 对 应 第 * 步 的 等 价 摄 动 修改 了 
对 应 于 以 前 各 步 的 某 些 等 价 摄 动 。 因 为 摄 动 是 非 对 称 的 、 某 些 摄 
动 后 的 主子 矩阵 甚至 会 有 复 共 思 堆 点 。 

对 于 基 个 , 证 明 所 有 报 动 矩阵 的 2 范 数 都 是 以 如 it2… 为 - 
界 是 容易 的 ,因此 我 们 必定 能 得 到 所 有 前 主子 式 的 正确 的 正 负 号 ， 


除非 * 什 落 在 以 所 有 的 主子 省 阵 的 二 n(n 十 1) 个 特征 值 为 中 心 


的 狭窄 区 间 内 。 因此， 以 这 个 方法 为 基础 的 分 半 方法 十 分 有 效 是 
不 足 为 奇 的 ， 实 际 上 ;我 们 发 现 ,对 于 用 我 们 讨论 过 的 方法 作 过 平 
衡 的 矩阵 ， 即 使 有 很 靠近 的 特征 信 ， 计 算 特征 值 的 误差 很 少 达 到 
2'27。 与 $37 ~$39 的 方法 相 比 ， 这 个 方法 对 我 们 有 更 大 的 吸 引 
力 , 因 为 我 们 后 面 推荐 的 计算 特征 向 时 的 方法 也 需要 (5 一 如) 的 
三 角形 分 解 .在 计算 机 上 。， 浮 点 数 尾数 的 数字 位 比 定点 的 数字 位 
少许 多 ， 我 们 册 才 讨论 的 方法 当然 给 出 更 精确 的 结果 。 不 足 之 处 
是 没有 一 个 严格 的 先 验 误差 估计 . 


三 对 角 型 的 特征 向 量 计算 


48, 现在 我 们 转 到 对 称 三 对 角 拭 阵 C 的 特征 向 量 的 计算 ， 我 
们 仍然 假定 C 没 有 零 元 素 PB, 不 然 的 话 ， 如 536 指出 的 C 的 特征 
向 量 问 题 化 为 一 些 较 小 的 三 对 角 和 矩阵 的 特征 向 量 问 题 ， 我 们 还 假 
定 用 分 闪 法 或 某 些 别 的 有 同 祥 高 精度 的 方法 包 经 得 到 了 精度 十 分 
高 的 特征 值 . 
初 看 起 来 这 问题 好 像 很 简单 ， 我 们 知道 ， 对 应 4 的 特征 向 量 
x 的 分 量 满足 方程 
《om — H+ Bn = 0, (48.1) 
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Bixis tt (mi rit Parin = 0 (i— 2 ,0 CO— 1), 
(48.2) 
pure 十 (cu — 14), = 0. (48.3) 
显然 ,x, 不 能 是 零 ,不 然 的 话 ,由 (48.1) 和 (48.2) 推 出 所 有 的 都 
是 零 ， 因 为 我 们 对 规范 化 因子 不 感 兴趣 , 我 们 可 令 x 一 1， 用 简 
单 的 递 推 得 到 
xr = 1) ph) /pp 8，(r 一 2 sn). 《48.4) 
推导 这 个 结果 只 需 等 式 (48.1) 和 (48.2), 但 所 得 的 re-: 和 x。 自 
动 满足 (48.3), 因为 我 们 有 
Boxai + (as — Lx 
一 (一 Do (ee — psd) popaal4) ] 
pp。 pp pl 
一 《一 1D)” pW) /8 ,Be = 0. (48.5) 
当 4 是 特征 值 时 , 因为 ps(14) 是 零 , 所 以 最 后 的 等 式 成 立 。 
次 此 利用 p.(4)， 我 们 得 到 了 特征 向 量 的 分 量 的 显 式 表 达 
式 . 现在 我 们 已 看 到 ，p.(4) 是 用 非常 稳定 的 方式 决定 特征 值 的 ， 
于 是 人 们 可 能 想象 :如 果 % 是 一 个 特征 值 的 很 好 的 近似 值 ,那么 用 
这 些 分 量 的 显 式 表 达 式 会 给 出 特征 向 量 的 很 好 的 近似 。 实 际 上 却 
不 是 这 样 ， 我 们 下 面 证 明 用 这 种 方法 从 一 个 极 好 的 特征 值 近似 值 
得 到 的 向 量 可 能 有 很 大 的 误差 。 


特征 向 量 显 式 表达 式 的 不 稳定 性 


和 9. 设 非常 接近 特征 值 ,但 不 是 准确 等 于 特征 值 , 又 设 * 是 
从 关系 式 (48.4) 得 到 的 对 应 这 个 4 什 的 准确 值 .由 定义 可 知 , x, 满 
足 等 式 (48.1) 和 (48.2). 分 量 ze -， 和 zx。 不 可 能 准确 地 满足 等 式 
(48.3), 否则 ,zx 会 是 满足 (4 一 11)x 一 0 的 非 零 向 量 , 因 而 1 是 

准确 的 特征 值 ， 这 与 我 们 的 假定 矛 牛 。 因 此 ,我 们 有 
Born 一 (on 一 2)xzn 一 8 关 0， (49.1) 

并 且 向 量 * 准确 地 满足 等 式 

(C 一 27)z = en, (49,2) 
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其 中 “。 是 单位 矩阵 的 第 = 列 ， 因 为 我 们 对 任意 的 非 零 因子 不 感 
兴趣 ,实际 上 * 是 下 述 方程 的 解 


(C —21)x ~ en. (49.3) 
根据 假定 ,矩阵 〈5 一 1) 是 非 奇异 的 ,因此 yx 给 定 为 
xz 一 (C 一 2 站 -ie (49.4) 


现在 为 了 着 重 指出 我 们 要 说 明 的 现象 与 C 的 病态 特征 向 量 问题 无 
关 , 我 们 假定 C 的 特征 值 是 明显 分 离 的 。 由 于 C 的 对 称 性 , 它 的 将 
征 向 量 对 于 和 矩阵 元 素 的 摄 动 是 不 敏感 的 ， 假 定 特征 值 依 顺 序 为 
机 >> (49.5) 

并 且 4 十 分 接近 和 ,因此 2 一 是 “小 ”的 ,但 4 一 和 (i 区 胡 ) 
“不 小 ”。 

令 mm yz 是 C 的 特征 向 量 正 交 组 ， 于 是 我 们 可 把 c。 
表达 为 如 下 形式 : 


ca > Yu Dri 1, (49.6) 
I 
因此 等 式 (49.4) 给 出 
x 区 au 一 2 


= Ta 一 人) 十 DY/ — 1). (49.7) 
Eat 


如 果 z* 要 成 为 内 的 一 个 好 的 近似 ， 那 么 重要 的 是 Ye 一 4) 
应 该 比 ri/(4; 一 4)(i 去 大 得 多 。 现在 我 们 知道 44 一 4 十 
“丰富 ”。 例 如 ,假定 用 十 位 十 进位 运算 ,并 且 4 一 2 一 10-*。 如 
果 Yk 是 10-， 那 么 x 几乎 完全 没有 坟 的 成 分 ,而 且 它们 几乎 
互相 正 交 。 

读者 可 能 觉得 土 面 的 论述 过 于 极端 ， 没 有 理由 认为 特征 向 量 
中 总 是 这 样 缺少 “。 的 成 分 。 我 们 的 看 法 是 ， 这 种 情况 是 极其 平 
常 的 ,我 们 将 在 后 几 节 给 出 说 明 。 

50, 从 等 式 (49.6) 和 4 的 正 交规 范 性 我 们 得 到 
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一 es 一 wk 的 第 * 个 分 量 。 (50.1) 
因此 , 如 果 规 范 化 向 量 ws 的 最 后 一 个 分 量 十 分 小 ,对 应 十 分 痿 近 
4 的 1， 从 显 式 表达 式 (48.4) 得 到 的 向 量 不 会 很 接近 xw。 
在 研究 什么 因素 会 使 w 的 第 ” 个 分 量 很 小 之 前 ， 我 们 返回 
去 看 等 式 (48.1),(48.2), 人 48.3). 《48.4) 给 出 的 向 量 = 是 方程 组 
《C 一 21)z 一 0 (50.2) 
的 前 〈= 一 1) 个 方程 的 准确 解 。 因 为 4 不 是 准确 的 特征 值 ,整个 
方程 组 的 解 只 能 是 零 向 量 。 代 葵 研究 前 (> 一 1) 个 方程 ,我 们 研究 
删除 第 + 个 方程 的 方程 组 ,我 们 仍然 得 到 一 个 非 零 解 ;除了 第 7 个 
方程 之 外 , 它 满足 方程 组 (50.2)。 因 此 ,这 个 向 量 是 方程 
(C—il)x=6e, (8 0) (50.3) 
的 一 个 准确 解 。 利 用 和 前 面 一 样 的 论证 可 得 : 如 果 & 的 第 + 个 
分 量 不 小 ,那么 它 是 坟 的 一 个 好 的 近似 ， 因 此, 如果 xu 的 最 大 
分 量 是 第 个， 那么 在 计算 wu 时 应 该 去 掉 的 是 第 * 个 方程 这 
个 结果 是 有 启发 性 的 但 不 是 特别 有 用 ,因为 我 们 不 能 预先 知道 内 
的 最 大 分 量 的 位 置 。 事实， 正好 是 我 们 希望 计算 的 ! 
与 党 去 的 第 * 个 方程 对 应 的 解 可 以 这 样 得 到 , 取 x 一 1， 并 
且 用 方程 (48.1) 和 方程 (48.2) 直 到 ;i 二 + 一 1 计算 aas sx 
然后 取 如 一 1 并 且 用 方程 (48.3) 和 (48.2) i 于 # 一 1, nn 一 2， 
十 1 计算 xs 考 ，，，…, 必 。 我 们 选择 克 结 合 这 两 部 分 疝 
量 使 得 


,~ kx, (50.4) 


并 取 

《ro ass ka) (50.5) 
如 果 这 个 过 程 没 有 含 人 误 状 ， 显 然 我 们 对 于 某 个 非 零 的 8 得 到 了 
(50.3) 的 准确 解 


数值 例子 


81. 现在 我 们 考虑 一 个 很 莹 透 的 二 阶 的 数值 例子 ,矩阵 C 定义 
为 
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_ [2 0.000984| ， 和 = 0.71326463… G51.1) 
0.000984 0.1216651” 4 = 0.12166336... 
我 们 取 4 的 近似 值 1 一 0.713265, 其 误差 是 10-4(0.36……), 现 
在 ,考虑 省 去 〈C 一 17)x 一 0 的 第 二 个 方程 得 到 的 特征 向 量 , 我 
们 有 


一 0.000002x: 十 0.000984z 一 0， (51.2) 
于 是 
xT = (1,0.002033). (51.3) 
如 果 我 们 省 去 的 是 第 一 个 方程 ,我 们 有 
0.000984xz; — 0.591600x: 一 0， (51.4) 
并 且 得 到 
zxT = (1,0.00166329). {51.5) 


我 们 如 果 考 虑 用 4 的 准确 值 会 发 生 什 么 情况 呢 ? 结论 是 明显 
的 ， 精 确 度 高 的 是 第 二 个 向 量 。 第 一 个 向 量 仅 到 小 数 点 后 三 位 正 
确 ,而 第 二 个 向 量 准确 到 八 位 。 这 是 由 前 一 节 的 分 析 所 预料 到 的 . 
4 的 最 大 分 量 是 第 一 个 ， 因 此 我 们 应 该 省 略 第 一 方程 。 如 果 现 在 
考虑 计算 对 应 % 的 特征 向 量 ， 我 们 发 现 现在 应 该 省 去 第 二 个 方 
程 . 注意 , 这 是 一 个 十 分 良 态 的 特征 值 和 特征 向 量 问题 ,所 以 我 们 
不 能 把 产生 的 困难 归结 为 问题 的 病态 。 
52 当然 ,上 一 节 的 例 于 是 有 点 人 为 的 ， 但 是 对 这 样 低 阶 的 矩 
阵 问题 这 是 不 可 避免 的 .第 二 个 例子 ,我 们 考虑 $45 的 矩阵 Wiis 
它 有 明显 分 离 的 特征 值 . 因为 它 是 对 称 的 ， 所 以 特征 向 量 问题 是 
臭 态 的 .现在 我 们 研究 对 应 最 大 特征 值 的 特征 向 量 。 如 果 有 
准确 特征 值 2, 那么 我 们 解 下 面 的 21 个 方程 
(7 五 一 WiDz 一 0 (52.1) 
中 的 任何 20 个 方程 就 可 得 到 准确 的 特征 向 量 。 假定 我 们 用 后 20 
个 方程 并 令 zt = 1, 我 们 得 到 
zn — (10 + 2%) = 0, (52.2) 
x hs Ir — xn 一 19)18 1)，(52.3) 
现在 ，% 肯定 大 于 10。 因此, 如果 我 们 假定 x+: > x+ > 0, 我 
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们 就 有 
和 2 {52.4) 
因为 zw 显然 大 于 ,这 表明 随 著 i 的 递 降 x; 递增 ， 至 少 一 直 
到 x 是 这 样 , 并 且 有 
wr Br 191x = 191 > 10°, (52.5) 
事实 上 ,因为 
(44 一 10)z = x (52.6) 
我 们 也 有 > ,并且 如 必定 落 在 10 与 11 之 间 ， 因此 ， 规 范 
化 的 特征 向 量 的 最 后 一 个 分 量 小 于 10-”。 于 是 ， 按 照 5 和 9 的 记 
号 ,我 们 有 7, < 10 7。 与 一 个 误差 仅 为 10 的 4 的 近似 什 对 应 
的 《48.4) 的 显 式 解 几乎 完全 没有 的 成 分 。 

这 在 表 9 中 得 到 了 说 明 。 那里 w 是 有 八 位 十 进位 的 准确 特 
征 向 量 , 而 x 是 以 4 一 10.74619420 正确 求解 (4 一 41)x 一 0 的 
前 20 个 方程 得 到 的 ， 因 为 计算 这 个 向 量 比较 困难 ， 我 们 给 出 的 数 
字 位 不 是 全 部 一 样 的 ,但 所 有 引用 的 数字 位 都 是 正确 的 ,并 且 它 表 
明了 * 的 性 态 。 注 意 , x 是 准确 地 使 用 显 式 公 式 〈48.4) 得 到 的 向 
量 . 


向 量 是 我 们 对 同样 的 信用 前 20 个 方程 实际 得 到 的 向 量 ， 
计算 使 用 八 位 十 进位 的 定点 运算 。 因 为 有 舍 4 误差 《并且 仅 因为 
这 点 ) 所 以 ? 与 * 不 同 。 但 是 它们 有 同样 的 性 质 : 其 分 基 很 快 下 
降 到 极 小 值 然后 再 增 大 ,显然 ， 这 是 一 个 不 稳定 的 过 程 。 在 前 面 
的 分 量 产生 的 伟人 误差 在 后 面 严 重地 扩大 。 这 种 现象 已 使 某 些 人 
认为 , y 从 真 特征 向 量 发散 是 使 人 误差 的 结果 , 而 对 于 给 定 精 
度 的 1 值 ,如 果 用 高 精度 运算 求解 前 20 个 方程 可 能 会 得 到 一 个 好 
的 特征 向 量 。 我 们 给 出 的 向 量 * 揭示 了 这 种 论断 的 雇 误 . 

在 表 9 中 第 四 个 向 量 z 是 4 一 10.74619418 的 前 20 个 方程 
的 精确 解 ,并 且 引 用 的 全 部 数字 是 正确 的 . 与 * 类似, 它 开始 很 快 
下 降 , 然 后 增 大 。 虽 然后 面 的 分 量 是 负 的 ,从 * 和 = 我 们 看 出 : 没 
调 一 个 二 你 数字 平 大 的 1 会合 前 20 个 方 各 的 准确 解 有 -点 像 w。 


最 后 ,我 们 给 出 用 后 20 次 递 推 得 到 的 向 量 w， 正 如 我 们 的 分 
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析 表 明 的 ， 逐 次 计算 的 分 量 立刻 


增 大 。 向 量规 范 化 之 后 它 与 “的 


差别 不 多 于 在 第 八 位 十 进位 上 一 个 单位 。 
家 98 
ws x y = w 

1.00000 0001.00000 0001.00000 000 1.00000 000 | 1.41440 4161XIOP 
.74619 418|0,.74619 42 人 0.74619 42 人 0 0.74619 418 | 1.05542 0141X109 
0.30299 9940.30299 998/0.30299 998 0.30299 993 | 4.28564 3680X10? 
0.08590 249)0.08590 360j0.08390 259| 0.08590 248 | 1.21500 8414X10 
0.01880 748|0.01880 783l0.01880 780 0.01880 742 | 2.66013 790x10% 
0.00336 1490-00335 303j0.00336 288| 0.00336 3220 | 4.75446 937X10' 
0.90050 815l0.00051 6810,00051 596| 0.00050 668 | 7.18725 327x10 
0.00006 659j0.00012 346|0.00011 Y89| 0.00005 694 | 9.41912 640x10 
0.00000 771i0.00043 95.I0.00039 724 一 0.00006 562 | 1.08984 9597XiOm 
Q.90000 0800.00372 1……|0.00335 645| 一 0.00063 09, | 1.12909 B198X40 
0.00000 007j0.03582 … |0.03231 537| 一 0.00608 3.， | 1.05914 3420X10% 
0.00000 001l0.3812  … |0.34391 06600 1.，| 9.07788 963X10 
0.00000 0000.4442X10: [4.00732 75 人 一 0.76917 ?7.16312 559X10? 
0.00000 O000.5642X10: |50.73426 45 寺 一 9.738 oe | 5.23693 576X10 
0.00000 0000.7686x10° 3.56680 106X10 
0.00000 0000.1128X10 | 现在 与 < 的 一 桩 分 基 的 绝 2.27383 533x10 
09,00000 000|0.1768X104 | 对 值 迅速 增 长 1.36242 D37x10 
0.00000 000/0.2950x10 7.70028 174X10 
0.00000 0000.5217 x 1 人 4.08658 380X 10 
0.00000 000[0.9751 x30° 2.07461 942zX104 
0.00000 000l0. 1920x 20 1.00000 000X10 
逆 迁 代 


53. 现在 ,让 我 们 研究 非 齐 次 方程 组 
(A4—1DN)r=b 
的 解 ， 其 中 5 现在 是 一 个 任意 规范 化 向 量 。 如 果 5。 表示 为 下 面 的 


形式 ， 


bo BL rom, 


那么 (53.1) 的 准确 解 是 


1 


(53.1) 


(53.2) 
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= 一 D3 Ta/ 人 一。 (53.3) 


暂且 候 定 我 们 能 解 (53.1) 那样 的 方程 组 , 并 且 不 带 舍 4 误差 。 我 
们 看 出 ,如 果 2 靠近 ix 但 不 靠近 任何 别 的 %, 那 么 x 比 5 包含 更 
多 的 w 成 分 ,要 * 很 好 地 逼近 w, 必要 条 件 是 7 应 该 不 是 小 
量 , 现 在 如 果 我 们 解 方程 组 


(4 — A)y— +, (53.4) 
并 且 不 带 合 入 误 关 ,我 们 得 到 
3 G535) 


并 且 y 比 * 包含 更 丰富 的 w 成 分 。 
显然 ,我 们 能 无 限 重复 这 个 过 程 , 得 到 一 个 愈 来 愈 占 优 的 

向 量 。 而 且 只 要 我 们 有 一 个 选取 的 好 办 法 使 5 不 过 分 缺乏 玖 
成 分 , 那么 第 二 个 向 量 y 通常 会 是 内 的 一 个 很 好 的 近似 。 例 如 。 
假定 

和 一 入 一 10 ,11%I> 107 GA), 7 = 10. (53.6) 
在 这 种 情况 下 , 我 们 有 理由 说 是 十 分 缺乏 w 成 分 的 ， 并 且 因 
与 其 他 特征 值 距离 也 不 远 。 我们 仍然 得 到 


y= Tel oA + Dy rm/ 一 和 
让 法 和 


= 10%m T+ DB) rf — 1, 
于 入 


10%y = ni + 10°% DY Yiws/ 一 2 (53.7) 
并 且 
-1 2 1 ,0s 3 - 
oD wa/ ~ <i [S| <10. 
Eek ha 
{53.8) 


因此 ,即使 是 在 这 种 不 利 铺 况 下 ,规范 化 后 的 向 量 》 也 几乎 是 准确 
的 z- 
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初始 向 量 & 的 选择 


54. 现在 剩 下 如 何 选 取 5 的 问题 。 信 得 注意 的 是 ,我 们 不 要 求 
“ 选 得 特别 好 , 即 ww 占据 最 大 的 成 分 但 不 应 该 过 分 地 缺少 坟 。 
现在 还 没有 一 个 办 法 对 所 有 情况 都 能 说 明 是 严格 地 满足 要 求 的 ， 
但 是 下 面 的 方法 在 实际 中 已 证 明 是 极其 有 效 的 ， 并 且 有 充分 理由 
使 我 们 相信 它 不 会 失败 . 

对 应 一 个 好 的 + 近似 值 , 按 $547 叙述 的 方式 对 《c 一 47) 实 
行 有 交换 的 Gauss 消去 法 〈 现 在 用 定点 或 浮 点 运算 都 一 样 )。 主 
元 行 wm，%”，mi 和 梁 数 m 与 有 关 交 换 的 信息 存储 在 一起。 以 
7 一 5 为 例 ,我 们 最 后 存储 的 矩阵 品 定 为 


WL 


Wm Vs 
U= Wi V3 Ws | (54.1) 
所 
ps 
因为 我 们 假定 没有 一 个 8 是 零 , 每 一 步 的 主 元 来 选 自 B41 与 p,， 
因此 没有 一 个 wm 是 零 。 最 后 一 个 元 素 自然 可 以 是 堆 ， 如 果 4 是 
准确 的 特征 值 ,计算 是 准确 运行 的 话 ,这 个 元 素 Pp。 确 实 是 零 . ( 见 
§56) 
现在 我 们 选取 这 样 的 右 端 ?， 当 消去 过 程 执 行 后 它 被 化 为 分 
量 全 是 1 的 向 量 <。。 我 们 不 必 确 定 5 本身， 注意 , 5 是 4 的 函数 . 
因此 ， 我 们 对 每 个 采用 的 是 不 同 的 右 端 。 如果 我 们 用 向 后 回 代 
解 方程 


Ux ce, (54.2) 

我 们 就 作 完了 逆 迹 代 的 一 步 。 如 打 p。 是 零 ， 我 们 可 以 用 一 个 适 

当 的 小 重 , 比 如 2 | Ci， 来 代替 它 ; 逆 迭 代 需 要 多 少 步 就 执行 多 

少 步 ,使 用 老 数 m; 实现 约 化 ， 用 矩阵 已 作 向 后 回 代 。 在 计算 另 一 
个 特征 值 的 特征 向 量 之 前 不 必 再 作 三 角形 分 解 . 

实践 中 ,我 们 发 现 这 样 选取 的 5 是 非常 有 效 的 ,在 一 次 迄 代 之 
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后 < 已 是 所 求 特征 向 量 的 一 个 好 的 近似 ， 并 且 第 三 次 迭代 决 不 是 


误差 分 析 


55, 在 第 九 章 我 们 还 要 研究 更 一 般 的 逆 渤 代 , 而 关于 对 称 三 对 
角 托 阵 的 情况 (在 Wilkinson (1963b》p.143~ p.147 中 ) 已 经 作 了 
详尽 的 讨论 。 为 此 ,我 们 这 里 仅 限于 作 一 点 形式 上 的 考察 . 

首先 注意 ， 对 于 一 个 给 定 的 近似 特征 值 我 们 总 是 用 同样 的 
(C 一 1 站 三 角形 分 解 , 它 相 当 于 有 一 个 小 误差 矩阵 的 《〈C 一 好 
十 下 ) 的 准确 的 分 解 。 因此 ， 不 管 作 多 少 次 迭代 ,我 们 能 够 希望 
得 到 的 最 好 结果 是 《C 十 F) 的 特征 向 量 。 矩阵 C 有 了 小 摄 动 ， 
我 们 不 能 期 望 准确 地 得 到 矩阵 C 的 特征 向 量 的 任何 数字 。 一般 而 
言 ， 这 对 任何 方法 都 是 对 的 ， 如 果 C 是 由 Givens 或 Householder 
方法 得 到 的 ,那么 这 种 误差 实际 上 已 经 存在 ， 

为 方便 起 见 , 我 们 假定 2 是 规范 化 的 ,我 们 执行 的 迭代 是 : 

《C — AD)set = Yrs Yer zo srr, (55.1) 
因此 每 迭代 一 步 x, 都 被 规范 化 ， 我 们 希望 在 实际 计算 中 能 发 现 
什么 时 候选 代 应 该 停止 ， 利 用 C 是 三 对 角 型 的 特点 ， 我 们 可 以 应 
用 第 四 章 863 的 理论 来 证 明 计 算 的 解 满足 方程 


{Co + Gr = ys (55.2) 
其 中 
lelh < tri2 一 (55.3) 
如 果 记 
2 一 十 E, (55.4) 
那么 (55.2) 可 以 写成 
(C—hDyn Tm ey — Gy pr/llzrtsls, (55.5) 


因为 我 们 假定 4 十 分 靠近 某 个 特征 值 ， 因 此 上 式 右 边 第 一 项 是 小 
的 ,而 从 (55.3) 看 出 第 二 项 也 是 小 的 。 如果 lx 由 大 ,那么 第 三 
项 也 将 是 小 的 。 因 此 ,我 们 得 到 的 ,rsl。 越 大 ,(55.5) 右边 的 界 
将 越 小 ,而 这 右边 是 对 应 于 y+ 和 %h 的 剩余 向 量 。 在 Wilkinson 
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(963b) p.139 ~p.147 中 ， 我 们 证 明 过 jj.sl。 在 如 不 过 分 全 
达 以 的 情况 下 必定 是 大 的 。 

从 上 述 的 研究 我 们 已 得 出 一 些 适 用 于 ACE 计算 机 的 经 验 规 
则 。 用 ， = 46 的 祁 点 运算 的 你 止 规则 是 : 
继续 渤 代 让 到 条 件 
| lial 2/100n (55.6) 
满 尽 ， 然 后 再 近代 -- 步 ， 

在 实际 计算 中 泛 代 从 来 不 需 多 于 三 次 ， 通 常 仅 需 两 次 。( 注 
意 , 第 一 次 选 代 仅 是 一 次 向 后 回 代 . ) 因子 11100 没有 太 大 意义 ， 
仅仅 是 各 免 做 不 必要 的 过 多 选 代 ， 有 人 可 能 认为 ， 在 合 + 误差 范 
国内 规范 化 的 y% 会 趋向 于 一 个 极限 ， 并 且 基于 这 个 极限 的 某 个 
条 件 而 不 是 (55.6) 会 成 为 更 自然 的 迭代 结束 准则 。 但 是 ,事实 并 
不 是 如 此 ,如 果 C 有 多 于 一 个 特征 人 非常 徘 近 2, 那么 % 最 终 是 落 
在 相应 的 特征 向 量 张 成 的 子 空间 中 ， 但 有 时 我 们 在 逐次 渤 代 中 得 
到 的 是 属于 这 个 子 空间 的 完全 不 同 的 向 量 。 这 素 次 得 到 的 完 
全 不 “ 收 售 ”， 


数值 例子 


56. 表 10 显示 了 我 们 用 这 个 方法 计算 的 W5 的 主 特征 向 量 
《 注 : 大 特征 值 对 应 的 特征 向 量 )。 取 特征 值 1 一 10.7461942 ( 准 
确 到 9 位 ), 并 显示 了 矩阵 的 主 元 行 . 为 方便 起 见 , 我 们 不 用 (54.1) 
的 形式 表示 这 个 和 矩阵, 而 只 写 出 各 列 的 ww” 及 wi。 前 11 步 都 
发 生 交换 ， 因 此 前 11 个 主 行 有 三 个 非 零 元 索 。 以 后 没有 发 生 交 
换 . 注意 ， 列 * 给 出 主 元 素 ， 并 且 没有 一 个 是 小 的 (参见 第 四 章 
566)。 对 一 个 准确 的 特征 值 ， 淮 确 的 计算 会 得 到 最 后 一 个 主 元 素 
bp。 是 零 ， 但 是 对 于 1 一 10.7461942, 即 使 是 用 准确 的 运算 , 主 元 
素 几 乎 都 是 准确 的 (前 11 个 仍然 是 1), 第 12 个 是 例外 , 它 是 完全 
不 同 的 ,这 如 表 所 示 。 要 使 最 后 一 个 主 元 素 变 “ 小 ”, 我 们 必须 要 有 
一 个 比 我 们 所 用 的 精度 高 得 多 的 4 值 。《〈 这 个 例子 的 更 详细 的 讨 
论 见 Wilkinson 1958a.) 
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长 to 


可 了 w x 规 烙 化 


1.00000 00 | —1.74619 42l1.00000 00—2.35922 2x10 |1.00000 00 
1-00000 00 | —2.74619 421.00000 00—1.76043 8X10 |0.74619 4 
1.00000 00 | 一 3.74619 42l1.00000 00/—7.14844 2XI0' |0.30300 00 
1.00000 00 | 一 4.74619 421.00000 00—2,02663 1X10 |0.08500 25 
1-00000 00 | -5.74619 421.00000 00/—4.43710 5X10 |0.01880 75 
1.00000 00 | 一 6.74619 42|5.00000 00| 一 7.93046 7X1I0 10.00336 15 
1,00000 00 | 一 7.746l9 431.00000 00 一 1.19885 3X10 |0.00050 82 
1.00000 00 | 一 8,74619 431.00000 00 一 1.57128 3X10 I0.00006 66 
1-00000 00 | 一 9.74619 42|1.00000 00 一 1.81935 8X10 i0.00000 77 
1.00000 00 |—10.74619 #2l1.00000 00/—1.89629 9X10 |o.00000 08 
1.00000 00 |-11.74619 42|1.00000 0 一 1.88118 0 0.00000 91 
一 4.07784 23 0.34996 24| 交换 在 第 | 一 0.25253 85 0.00000 00 
一 12.66037 37 | 1.00000 00| 开 步 停止 -0.08518 65 jo.00000 o0 


a 


—13.66720 76 1,00000 00| 一 0.07849 27 0.00000 0 
一 14.67302 64 1.00000 0 一 0.07277 54 |0.00000 00 
~15.67804 19 1.00000 一 0.06783 52 i0.00000 00 
一 16.68241 07 1.00000 0 一 0.06352 36 lo.00000 0 
一 17.68623 08 1.00000 00 一 0.05972 ?4 |o.ooo00 0 
一 18.68965 31 1.00000 09 一 0.05635 39 .00000 00 
一 19. 的 268 87 1-00000 ol 一 0.05323 40 jp.00000 00 
一 20.69541 39 一 pa 一 0.04831 99 0.00000 00 


表 10 的 第 4 列 给 出 以 为 右 端 ,用 男 代 后 得 到 的 向 量 ， 我 们 
看 出 , x 的 某 些 分 量 十 分 大 ,根据 上 一 节 的 评论 ， 这 意味 着 规范 化 
后 的 x* 和 4 给 出 一 个 小 的 剩余 向 量 ， 因 此 ,由 于 与 明显 分 
离 , 规 范 化 后 的 * 是 特征 向 量 的 一 个 好 的 近似 值 ， 事 实 上 , 它 几 乎 
准确 到 运算 精度 要 求 的 小 数 点 后 第 7 位 ， 

注意 ,在 回 代 中 不 是 全 部 。 的 分量 都 同等 重要 ， 最 后 的 11 个 
分 量 是 意义 不 大 的 ， 在 规范 化 后 ， 它 们 的 值 小 到 可 以 忽略 ， 事 实 
上 ,如 果 对 Wi 的 每 个 特征 值 依次 执行 相应 的 计算 ,我 们 发 现 , 对 
不 同 的 特征 向 量 ,。 中 要 作用 的 分 量 是 不 同 的 。 用 46 位 二 进位 运 
算 ，Wa 的 每 一 个 特征 向 量 在 一 次 迭代 之 后 准确 到 40 或 更 多 的 
二 进位 ,在 第 二 次 迭代 之 后 所 有 数字 位 全 都 准确 ,这 可 看 作 方 法 有 
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加 


效 性 的 一 个 度量 。 

57. 人 们 自然 要 问 ， 这 个 过 程 是 否 可 能 失败 ,是 否 会 得 到 总 不 
满足 (55.6) 的 一 系列 迭代 信 电 9 看 来 这 好 像 是 不 可 能 发 生 的 ， 过 
程 失败 仅仅 在 下 述 情况 下 可 能 发 生 , 即 我 们 使 用 这 技术 时 ,向 量 。 
本 身 不 是 明显 出 现 的 ， 它 包含 所 求 的 向 量 的 成 分 为 2 数量 级 或 
者 更 小 ， 并 且 伟人 误差 不 导致 这 个 成 分 增长 。 

这 个 技术 助 我 们 理解 术语 的 “病态 "的 含义 。 我 们 使 用 的 
矩阵 《C 一 117) 几乎 是 奇异 的 ， 因 为 4 几乎 是 特征 什 。 因 此 , 对 
方程 组 (C 一 灯 )xwi 一 ,我 们 得 到 的 计算 解 通常 大 多 数 的 有 效 
位 都 是 不 对 的 。 然 而 就 规范 化 的 x 来 说 , 这 个 过 程 是 良 态 的 , 除 
非 C 有 多 于 一 个 特征 值 接近 2。 即使 在 这 种 情况 下 ， 特 征 向 量 的 
误差 也 只 不 过 是 C 的 元 素 小 摄 动 带 来 的 那些 不 可 避免 的 误差 。 


靠近 的 特征 值 和 小 的 B: 


58. 从 上 节 的 论证 我 们 看 出 : ”最 高 精度 的 特征 向 量 将 是 某 个 
矩阵 (C 十 F) 的 准确 的 特征 向 量 , 其 中 了 是 满足 (58.1) 的 小 摄 
动 矩 阵 . 


Hel < (9)2™, (58.1) 
而 f(n) 是 = 的 某 个 函数 ， 它 与 使 用 的 运算 类 型 有 关 。 通 常 ,对 于 
每 一 个 特征 值 ,矩阵 F 是 不 同 的 。 现 在 假定 C 有 两 个 特征 值 2 和 
,它们 的 差 是 379, 而 2 一 (i 二 1, 2) 都 不 小 。 那 么 ,我 们 可 
以 期 望 得 到 近似 的 向 量 v， 和 vs 使 得 


二 二 十 NoD2(2oiom + Dm), (58.2) 


mt f(r + Bh), 8.3) 


其 中 所 有 的 加 和 各 都 是 1 数量 级 的 。 换 句 话说 ，v, 和 v， 分 
别 受到 重要 的 成 分 mw 和 tw 的 影响 ， 而 且 也 受到 其 他 次 要 成 分 
好 的 影响 , 天 而 与 w 和 坟 差别 变 大 了 ， 我 们 有 
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vo = (kt ha)fn)2 + 2 (fn DY hkis (58,4) 


通常 ， 如 和 名 无关 , 当 接近 :时 ,两 个 特征 值 变 得 向 靠近 ,vw 和 
0 变 得 愈 来 愈 不 正 交 。 

我 们 可 以 用 Jacobi 方法 求 三 对 角 和 矩阵 的 特征 向 量 的 情况 与 
它 作 对 比 。 此 时 我 们 有 


i 29) (zoom 十 ah， (58.5) 


为 一 二 十 2- 和 (n) (xm 十 Dm), (58.6) 
名 


其 中 g(x) 仍然 是 ”的 某 个 函数 ， 但 是 因为 现在 有 使 人 误差 的 影 
咏 则 显得 更 大 些 , 它 大 于 f(x)。 可 是 ,我们 从 519 知 道 , v， 和 ，" 
是 “几乎 正 交 的 ”, 因 此 大 和 如 几乎 是 数量 相等 符号 相反 。 虽 然 
随 荐 ?接近 !。2 和 v 不 可 各 免 地 分 别 受 到 m 和 ww 更 多 的 
影响 ,但 正 交 性 不 受 损害 - 


对 应 重 特征 值 的 线性 独立 特征 高 量 


59. 现在 ,我 们 假定 两 个 特征 值 是 如 此 接近 ， 以 至 于 在 运算 精 
度 内 是 相等 的 . 例如 WW 去 的 2 和 2 就 是 这 样 ， 除 非 我 们 的 运 
算 精 度 非常 之 高 ，Jacobi 方法 给 出 两 个 几乎 正 交 的 特征 向 量 ， 它 
们 所 张 成 的 子 空间 与 w 和 的 相同 。 这 些 向 量 信 有 很 小 的 专 
成 分 在 一 3,4，…，z)， 但 它们 是 和 ww 的 组 合 ,几乎 是 正 交 
的 . 

另 一 方面 , $53~$55 的 逆 挝 代 对 一 个 给 定 的 4 值 只 产生 一 个 
特征 向 荔 。 邵 果 计 算 的 %, 和 2 正好 准确 相等 ,那么 我 们 必需 有 
计算 w 和 ww 的 子 空间 中 第 二 个 向 量 的 方法 。 当 C 有 十 分 靠近 
的 特征 值 时 ， 我 们 发 现 用 554 的 方法 得 到 的 特征 向 量 对 于 所 使 用 
的 4 值 极端 敏 感 。 

我 们 可 以 用 一 个 简单 的 例子 来 说 明 。 考 虑 一 个 三 对 角 和 矩阵 
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3 0 0 
0 2 1 
0 1 2 
有 二 重 特征 值 2 一 3， 对 应 的 线性 独立 特征 向 量 是 〈1, 9, 0) 和 
(0,1,1)， 因 为 记 一 0, 我 们 用 10 代替 它 , 于 是 所 有 Pi 都 不 为 
零 . 现在 如 果 我 们 对 1 一 3 执行 一 次 逆 迁 代 , 得 到 的 向 量 是 


2 X 10 


， (59.1) 


10 二 1 的 规范 化 形式 。 (59.2) 


NI- slP 


10° 


男 一 方面 ,如 果 我 们 取 1 一 3 一 10-:, 得 到 的 向 量 是 

0 0 
10° 1 
10° 1 
当 4 一 3 一 2 X 10-: 时 ,给 出 


-了 
(的 一 | 1 | 的 规范 化 形式 。 (59.4) 


3 
(7) 10° 1 

虽然 2 的 微小 改变 使 得 产生 的 向 量 很 不 相同 ， 但 是 这 些 特征 向 量 
都 落 在 正确 的 子 空间 内 .第 三 个 特征 值 + 一 1 是 单 重 的 。 对 于 任 
何 接近 1 的 2 什 都 唯一 地 得 到 特征 向 量 (0,1, 一 1). 

计算 的 特征 向 量 对 于 特征 全 微小 改变 的 这 种 极端 敏感 性 可 以 
转化 成 有 利 的 因素 ， 它 可 以 用 于 导 找 对 应 于 重 特征 值 或 非常 拿 近 
的 特征 值 的 独立 的 特征 向 量 。 在 ACE 机 上 ， 我 们 对 规范 化 的 矩 
阵 作 计算 ， 我 们 人 为 地 使 特征 值 的 分 离 至 少 是 3X2-'。 实 际 计算 
中 ， 这 种 办 法 效果 非常 好 。 总 能 提供 足够 数目 的 线性 独立 特征 向 
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的 规范 化 形式 。 (59.3) 


重 。 以 WW 去 为 例 ， 我 们 用 这 种 方法 得 到 了 完备 的 独立 特征 向 量 
组 。 如 果 我 们 有 一 个 多 重 特征 值 ,我 们 就 用 2 力士 3 X 2， 
回填 6 X 27',.…*， 也 许 值得 提出 的 是 ,比如 说 ,用 为 十 9 X 2 这 
个 值 不 会 使 计算 的 特征 向 量 精度 变 环 。 4 接近 特征 值 的 程度 只 影 
响 收 化 速度 而 不 影响 逆 先 代 可 能 达到 的 精度 。 当 然 。 我 们 不 能 期 
望 计算 的 向 量 正 交 , 但 我 们 记 住 特征 值 不 是 非常 地 接近 , 正 交 性 是 
不 变 坏 的 ， 可 是 ， 我 们 必须 承认 问题 的 这 种 解法 有 点 欠 佳 。 如果 
我 们 要 寻求 正 交 向 量 ,这 个 方法 是 有 缺点 的 ,我 们 还 必须 对 计算 的 
向 量 运 用 Schmidt 正 交 化 方法 .除非 这 个 过 程 建立 在 较 牢固 的 基 
础 上 ,否则 这 里 还 存在 一 个 危险 ,我 们 将 得 不 到 有 关子 空间 的 足够 
的 数字 信息 ， 例 如 ,两 个 计算 向 量 可 以 想像 为 


vi 0.6m 十 0.4 + 2 ja， (59.5) 
ee 


vi = 0.61m 十 0.39z + 2 Ds, (59.6) 
名 
其 中 加 ,如 都 是 1 的 数量 级 ， 这 两 个 商量 在 数学 上 是 线性 无 关 
的 ,但 是 与 第 一 个 向 量 正 交 的 方向 不 能 较 准 确 地 确定 。 事 实 上 ,我 
们 有 


ti— w= 00lm t+ 0.01u + 27 DY (hi — ui, (59.7) 


i 


因此 ,在 正 交 化 过 程 中 要 损失 两 位 十 进位 数字 。 

有 时 ， 确 定 C 的 原 矩 阵 有 多 重 特征 值 时 ，C 有 基 些 8 ;元 素 几 
平 是 零 ， 我 们 可 以 把 C 分 裂 成 一 些 较 小 的 三 对 角 和 矩阵 的 直接 和 ， 
辣 的 三 对 角 甜 阵 的 特征 向 量 自动 地 准确 正 交 可惜， 经 验 表明 
我 们 不 能 依靠 小 Pi 的 出 现 ， 耸 阵 开 盐 又 从 另 一 个 方面 说 明 我 们 
可 以 与 有 明显 的 三 对 角 矩 阵 分 解 的 情况 相差 很 远 .尽管 如 此 ,即使 
对 WW 去 我 们 也 可 以 分 裂 ,例如 把 pu 改 为 零 ,分 烈 短 阵 为 11 阶 的 
和 10 阶 的 两 个 矩阵 ,我 们 确实 得 到 很 高 精度 的 独立 的 正 交 的 向 量 ， 
它们 张 成 的 子 空间 对 应 于 非常 靠近 的 特征 值 对 .因此 ,这 种 分 解 可 
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A 


也 


能 总 是 允许 的 ， 我 们 需要 的 是 某 种 确定 何 时 何 地 作 分 解 的 可 靠 方 
法 , 


计算 特征 向 量 的 交 蔡 方 法 


60. 目前 ,我 们 讨论 过 的 逆 挝 代 方法 似乎 是 计算 三 对 角 和 矩阵 的 
特征 向 量 的 已 知 方法 中 最 为 满意 的 一 个 ， 在 任何 情况 下 ， 它 比 计 
算 特 征 值 的 工作 量 少 得 多 。 此外， 在 逆 选 代 中 它 给 出 一 些 有 用 的 
信息 .在 更 一 般 的 特征 向 量 问题 中 , 它 也 是 最 重要 的 方法 之 一 。 

但 是 ,人 们 也 提出 了 一 系列 交 蔡 的 方法 ,其 中 最 成 功 的 也 许 是 
Dekker (1962) 提出 的 方法 ， 他 的 方法 实质 上 是 以 550 描述 的 方 
法 为 基础 。 我 们 取 x 一 1， 并 用 方程 (48.1) 和 《48.2) 依次 计算 
三 太 ,""*。 内 要 |xrtd| 之 1x,|， 这 过 程 就 继续 下 去 。 如 果 我 们 
执行 到 某 一 步 ,这 个 条 件 不 满足 ,我 们 取 + 一 1, 并 从 方程 (48.3) 
和 (48.2) 依 次 计算 zi 区 -直到 |x| 天 | 好 | 为 止 . 然 
后 ,我 们 转 回 到 向 前 计算 并 继续 作 到 出 现下 降 为 止 。 

如 果 我 们 有 | 和 | > | 和 | > | > 人 及 | > 1 > 
|-z| 之 “我们 就 交替 地 执行 这 二 者 。 反 之 ,例如 , 如果 我 们 有 

| 和 >> | > Isl sla lal |), (60.1) 


并 且 
1 > | 区 > 1-sl, (60.2) 

那么 ,我 们 就 来 回执 行 两 次 。 但 在 第 二 次 转 到 向 前 代入 后 , 若 1xil 
增 大 ,我 们 将 继续 次 前 代入 ,并 且 测 弃 #+， 类 似 地 ， 我 们 可 能 最 后 
放弃 x;。 如 果 在 第 一 次 出 现 重 迭代 时 ， 两 个 序列 x; 和 必 都 是 下 
降 的 ,这 个 交替 就 在 内 部 点 上 相遇 了 。 在 这 种 情况 下 ,两 个 序列 按 
照 550 描述 方法 结合 起 来 . 

通常 ,这 好 像 给 出 好 的 结果 ,但 是 当 向 前 与 向 后 序列 在 相交 时 
是 迅速 下 降 的 .它们 似乎 是 不 准确 的 。 当 C 有 病态 地 靠近 的 特征 
信 , 但 没有 了 明显 地 指示 出 如 何 划 分 抢 阵 的 & 时 ， 要 修改 这 个 过 程 
以 便 得 到 独立 的 疝 量 ,看 来 是 不 容易 的 ， 向 前 .向 后 代 人 的 一 些 变 
形 已 由 作者 和 其 他 人 作 了 研究 。 
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数值 例子 


1. 为 了 说 明 Dekker 方法 的 性 质 ， 我 们 芳 虞 多 去 的 对 应 于 
特征 值 4 的 转 征 向 量 的 计算 ,其 中 非常 舍 近 aa。 这 个 矩阵 是 疼 
对 称 的 ( 即 关于 从 w， 1 到 1, = 的 对 角 线 对 称 ), 因此 向 前 和 向 后 序 
列 恒 等 ， 开 始 ,两 个 序列 都 递 降 ， 于 是 我 们 交替 地 转 到 向 前 \ 向 后 
序列 ， 当 我 们 达到 时 ， 向 前 序列 开始 递增 并 继续 正确 地 递增 直 
到 xs。 因此 ， 向 后 序列 被 放弃 摔 。 在 表 11 中 给 出 这 个 结果 。 初 
看 起 来 这 结果 有 点 令 人 感到 失望 ， 因 为 mm 最 后 达到 的 实际 值 显 
然 完 全 由 1 的 误差 和 舍 人 误差 决定 ， 可 是 xw 和 xx 几乎 准确 地 满 
足 第 21 个 方程 ,因此 由 * 导出 的 规范 化 向 量 必定 给 出 分 量 为 数量 
级 10 ”的 剩余 向 最 , 所 以 在 运算 精度 的 范围 内 它 落 在 前 两 个 特征 
向 量 张 成 的 子 空间 内 . 我们 给 出 这 规范 化 的 特征 向 量 , 如 果 wm 和 
二 是 W 坟 的 前 两 个 按 无 穷 范 数 规范 化 的 特征 向 重 ， 那 么 我 们 已 经 
证 实 了 


x = 0.50000233u 十 0.49999767wa + 0(10-a)。 《61.1) 
如 果 我 们 企图 用 一 个 稍微 不 同 的 1 值 去 计算 另 一 个 特征 向 量 ， 
我 们 看 到 仍然 接受 向 前 序列 但 是 x 与 它 以 前 的 值 完全 不 同 了 
不 幸 这 个 新 的 向 量 * 使 得 

Em (0.5 + 8)u + {0.5 — e)us + O(107), (61.2) 
其 中 仍然 是 10 数量 级 。 因此 ， 我 们 得 不 到 关于 由 和 如 的 子 
空间 中 与 = 正 交 的 方向 的 准确 信息 。 然 而 ,值得 注意 的 是 ,如 果 用 
原来 的 4 什 , 我 们 从 应 后 序列 而 不 是 向 前 序列 出 发 ,那么 我 们 最 终 
接受 向 后 序列 , 它 是 与 向 前 序列 昼 等 的 。 计 算 的 向 量 是 

0.500002334: 一 0.49999767xzn 十 Of10-9) ， (61.3) 

它 与 方程 (61.1) 的 = 几乎 正 交 。 用 这 个 技巧 我 们 从 一 个 1 值 获得 
关于 子 空间 的 完全 的 数字 信息 。 


振 对 角 矩 阵 特征 问题 的 评论 
62. 我 们 已 经 相当 详细 地 讨论 了 三 对 角 甜 隆 的 特征 问题 ,这 不 
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表 11 
叉 一 10.74619 419 


zi 一 1.00000 000 x = 0.17133 492 2 1.00000 000 
z=0.74619 419 xu = 1.65376 40 x 0.74619 419 
xs = 0.30299 996 xu =1.42928 06X10 | xis = 0.30299 996 
x = 0.08590 254 xu 天 .09061 09X to | x 0.08590 254 
加 二 0.01880 764 zk 一 7.21454 要 Xi0] xi 一 0.01880 764 
x sr 0.00336 217 x 4.03655 65X10 | xis =0.00336 217 
=0.00051 204 wi 1.84368 27X10*| ,=0.0005! 204 
一 0-00009 215 xz 一 6.50313 78X10+| xi 一 0.00009 215 
mm 一 0.00020 177 一 1.60151 97X19 

#19 一 0.00167 257 aa = 2.14625 06X 107 

zu 一 0.01609 942 

规范 化 的 向 量 

x = 0.00000 466 zs = 0.00000 000 xu D00050 815 
x 一 0.00000 348 x3 = 0.00000 000 146 
二 0.0000D 141 xm 0.00000 001 xu 一 0-03880 7 扫 
如 一 0,00000 040 xu 一 0.00000 007 2 08590 249 
=0.00000 009 zu = 0.00000 080 x 一 0.30299 993 
ze = 0.00000 002 x = 0.00000 771 za 一 0.74619 418 
x = 0,00000 000 0.00006 659 ar 一 1.00000 000 


但 是 因为 它 本 身 是 重要 的 ,而 且 它 也 提供 了 一 个 有 益 的 例子 ,说 明 
了 二 典 分 析 与 数值 分 析 之 间 的 差别 。 在 我 们 讨论 过 的 方法 中 若干 
地 方 出 现 极限 过 程 , 当 数 量 的 “小 ”是 由 计算 的 精度 严格 限制 时 ,在 
实际 计算 中 极限 过 程 是 难以 说 明 我 们 能 期 望 什 么 样 的 结果 。 我 们 
所 给 出 的 例子 不 应 看 作 是 单纯 的 数值 例证 ， 希 望 读者 仔细 地 研究 
这 些 例 子 , 如果 希 望 发 明 一 个 计算 特征 向 量 的 方法 , 它 比 我 们 已 经 
给 出 的 方法 更 好 ,还 应 该 补 记 它们 。 


Givens 和 Householder 方法 的 完成 


63. 为 了 完成 Givens 方法 或 Householder 方法 ， 我 们 必需 从 
三 对 角 撼 阵 的 特征 向 量 推 导出 原 矩 阵 的 特征 向 量 . 对 于 Givens 方 
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法 这 几乎 与 $16 讨论 的 关于 Jscobi 方 靶 的 计算 的 一 样 。 如 果 = 
是 已 的 一 个 特征 向 量 , 那么 下 式 确 定 的 >， 

zs = RIRT...RIx (63.1) 
就 是 4。 的 特征 向 量 ,其 中 R, 是 变换 矩阵 。 通常 ,有 


主 (oD 2) 


个 旋转 ， 每 一 个 向 量 * 的 计算 包含 2(z 一 1)(n 一 2) 个 乘法 ， 如 
果 需 要 计算 全 部 特征 向 量 , 这 部 分 计算 大 约 有 2m 个 乘法 、 

对 于 Housebholder 方法 同样 有 

zw PP Psax, (63.2) 

其 中 忆 是 变换 矩阵 。 自然 ，P 是 用 3530 或 $33 描述 的 因子 形式 
了 一 ww?/2K? 或 者 了 一 2ycy37 yw 

如 果 我 们 记 x 一 x* ”和 x"? 一 Px" 那么 对 于 第 一 个 公 
式 我 们 有 


Tr 
gD (jw #0 (63.37 


侈 复 每 一 个 向 量 约 需 辣 个 和 法 ,因此 要 计算 全 部 = 个 就 有 辣 个 匀 
法 。 注意 ,对 Givens 方法 和 Housebolder 方法 恢复 全 部 向 量 都 比 
简化 为 三 对 角 型 需 守 更 多 的 计算 . 

64. 恢复 原 矩 阵 的 特征 向 量 是 数值 稳定 的 ,并 没有 提出 什么 有 
意义 的 特殊 问题 ,我们 所 需要 的 一 切 几 乎 都 在 第 三 章 的 分 析 中 包 
括 了 .我 们 可 以 网 时 处 理 Givens 方法 和 Householder 方法 。 

令 R 表 示 与 计算 的 4 对 应 的 准确 正 交 乱 阵 的 准确 乘积 ， 我 
们 有 

CaRdRT+F, (64.1) 
对 于 各 种 方法 我 们 已 建立 了 的 界 。 如 果 = 是 C 的 计算 的 规范 化 
特征 向 量 , 那么 我 们 有 


Cr 一 jz 一 3 {64.2) 
其 中 ll 外 的 界 已 由 误差 分 析 给 出 ， 因 此 ， 
(C+ Gx = 1r, {64.3) 
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这 里 如 果 4 是 对 应 x 的 Rayleigh 值 ，G 可 以 取 为 对 称 矩 隆 , 并 且 
从 第 三 章 556 我 们 有 

HGb = lalh. (64.4) 
最 后 ,第 三 章 $23, $34 和 45 的 分 析 给 出 一 个 + 的 界 ， 这 1 是 利用 
计算 的 “定义 的 ， 


z= Rx 二 (64.5) 
结合 (64.1) 和 (64.3) 我 们 得 到 
(如 十 RIFR+ RTGR)RTr = LRTx, (64.6) 


因此 ，R?x 是 一 个 对 称 矩 中 的 准确 特征 向 量 ,这 个 插 阵 与 如 相差 
一 个 摄 动 矩阵 , 揉 动 矩阵 的 范 数 的 界 是 IF 十 Gl, 而 * 与 Rix 
的 差 是 帮 的 界 与 特征 向 量 间 题 的 条 件 天 关 。 

对 于 病态 向 量 ,主要 的 威胁 来 自 4。 的 对 称 摄 动 可 能 产生 的 影 
响 , 注 意 , G 仅 依赖 于 我 们 计算 C 的 特征 向 量 的 技术 ， 而 和 与 
三 对 角形 化 方法 有 关 . 可 能 除了 用 有 累加 的 浮 点 运算 Householder 
方法 之 外 ， 向 量 的 误差 办 由 下 的 春 所 支配 ， 对 于 Householder 方 
法 ,了 的 界 很 小 ,此 时 G 引 进 的 误差 起 着 与 相当 作用 。 


方法 的 比较 


65, 如 果 我 们 只 对 特征 值 感 兴趣 , 那么 与 Givens 方法 或 Ho- 
useholder 方法 相 比 , Jacobi 方法 没有 什么 特别 的 东西 值得 我 们 推 
荐 的 . 假如 Jacobi 方法 化 矩阵 为 对 角 型 用 了 6 次 扫描 ， 这 约 为 
Givens 方法 三 对 角 化 的 9 倍 , 是 Householder 三 对 第 化 的 18 倍 . 
如 果 只 想 计算 少量 特征 信 ，Jacobi 方法 最 不 合适 。 因 为 Househol- 
der 方法 简化 比 Givens 的 快 一 倍 ,而 且 有 关 变 换 的 信息 存储 空间 
可 节省 一 半 , 这 时 Housebolder 方法 显 出 绝对 的 优势 、 

三 个 方法 实际 上 都 很 精确 ， 辕 而 精确 度 不 能 作为 决定 性 的 指 
标 , 但 是 在 任何 方面 ,比较 起 来 我 们 都 推荐 Householder 和 Givens 
方法 。 如 果 有 内 积累 如 ，Householder 方法 是 最 精确 的 。 

有 一 点 对 于 Givens 方法 是 有 利 的 . 如 果 要 消去 的 元 素 已 经 
是 零 ,那么 相应 的 旋转 就 可 以 略 去 ; 而 在 Householder 方法 中 Wi 
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的 一 个 元 素 是 零 却 很 难得 到 什么 好 处 。 如 果 原 矩阵 是 十 分 稀 芍 
的 ,那么 需要 的 旋转 数目 将 大 大 减少 ， 虽 然 随 着 过 程 发 展 , 零 元 素 
会 逐渐 填 人 非 零 数字 ,但 后 来 需要 的 旋转 比 前 面 的 计算 量 少 - 

如 果 需 要 特征 向 量 , 那么 对 于 Jacobi 方法 有 一 点 是 值得 提出 
的 。 在 一 般 情况 下 。 Jacobi 方法 计算 的 特征 向 量 比 Givens 或 
HHouseholder 方法 或 $53 ~ $55 的 方法 计算 的 特征 向 量 有 较 大 的 成 
分 与 有 关 的 子 空间 正 交 。Jacobi 方法 的 优点 是 ,给 出 的 向 量 几 平 
正 交 、 从 编程 序 的 角度 来 看 ，Jacobi 方法 极其 简单 可 能 被 推荐 作 
某 些 应 用 。 总 的 来 说 ,即使 希 要 特征 向 量 ， 我 们 感到 Householder 
方法 是 可 取 的 ， 并 且 在 确定 对 应 非常 华 近 的 特征 值 的 独立 向 划 的 
方法 中 存在 的 美中不足 ， 并 不 家 贿 我 们 要 去 使 用 那些 速度 慢 精度 
低 的 方法 。 


拟 对 称 三 对 角 和 矩阵 
66. 一 般 的 三 对 角 和 矩阵 C 的 元 素 可 由 下 列 等 式 定义 
Ci iti 其 他 cr 一 0 《66.D 
通常 ， 即 使 这 些 元 素 是 实 的 ,这 祥 的 矩阵 的 特征 值 也 可 能 是 复 的 。 
但 是 如 果 w 是 实 的 并 且 
Piri> 0 人 一 2 《66.2) 
那么 可 以 用 对 角 和 矩阵 马 作 相似 变换 把 矩阵 C 变 换 为 实 对 称 矩 阵 . 


假若 我 们 用 下 述 关 系 定义 也 
da 120 一 737 00 (66.3) 
那么 
DrCD 一 7T， (66.4) 


其 中 工 是 三 对 和解 型, 并且 
Ws rr ti = (BT ean), (66.5) 
如 果 有 Bi 或 关 是 零 ， 那 么 C 的 特征 值 是 一 些 较 小 的 三 对 角 和 矩阵 
的 特征 值 ,因而 不 会 产生 任何 困难 . 
像 537 ~§39 那样 ， 我 们 可 以 用 Sturm 序列 性 质 去 计算 特征 
值 ,只 不 过 是 用 pry, 代替 房 。 有 时 ,这 种 元 素 a; 是 实 的 , 8;,71 满 
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足 等 式 (66.2) 的 三 对 角 矩 阵 称 为 扑 对 称 三 对 角 婚 阵 。 


特征 向 量 的 计算 


67. $53 ~§55 描述 的 计算 特征 向 量 的 方法 没有 考虑 对 称 性 ， 
而 县 有 交换 的 Gauss 消去 法 一 般 要 破坏 对 称 性 ,因此 它 可 议 直 接 
应 用 于 拟 对 称 和 矩阵. 可 是 在 本 蔬 中 ,后 面 的 章节 涉及 三 对 角 矩 阵 的 
特征 向 量 ， 这 些 和 矩阵 育 时 是 从 一 般 的 矩阵 经 相似 变换 得 来 的 。 因 
此 ,我 们 对 某 个 非 奇 异 矩阵 芮 ,有 

XT4X 一 C。 (67.1) 
对 应 C 的 特征 向 量 7 我 们 感 兴趣 的 是 向 量 *, 其 定义 为 

r= Xy, (67.2) 

因为 这 是 4 的 特征 向 量 。 通常 元 素 8 和 7, 的 数量 级 变化 很 大 ， 
是 六 为 X 有 一 些 列 的 数量 级 变化 很 大 。 如 果 用 下 面 定义 的 了 代替 
x 


Y 一 XD， 《67.3) 
其 中 也 是 某 个 非 奇 异 的 对 角 和 矩阵, 那么 我 们 得 到 

Y-4Y 一 DCD 一 7T， (67.4) 
其 中 工 也 是 三 对 角 型 。 DD 的 改变 将 影响 (7 一 17) 在 Gaus 消去 
中 的 交换 ,也 影响 在 $54 向 后 辑 代 中 用 作 右 端的 向 量 。 的 效果 .一 
般 说 来 ,适当 的 方法 是 选择 刀 使 得 Y 的 列 的 数量 级 相同 ,然后 对 所 
得 的 矩阵 应 用 4$53~$55 的 技术 。 


形 如 Ax 一 4Bx 和 4Bx 一 2x 的 方程 


68, 在 第 一 章 $31 ~$33 我 们 考虑 过 下 列 形式 的 方程 
Ax= Br (68.1) 
和 
ABx 一 hz， (68.2) 
其 中 4 和 8B 是 实 对 称 的 ,并 且 它 们 之 中 至 少 有 一 个 是 正定 的 。 
例如 ,我 们 假定 8 是 正定 的 ， 并 且 我 们 已 求解 它 的 特征 问题 
因此 对 某 个 正 交 知 阵 ,我 们 有 
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RIBR = diag(p) 一 D’, (68.3) 
于 是 (68.1) 等 价 于 标准 的 特征 问题 


Pz = Ae, (68.4) 
其 中 P 一 D-'RTARD"*, 并 且 
= DRYx, (68.5) 


如 果 我 们 已 经 用 Jacobi 方法 或 Givens 方法 或 Householder 
方法 解 3 的 特征 问题 ,那么 我 们 有 因子 形式 的 ,并 且 可 以 从 这 些 
因子 计算 出 实 对 称 拖 阵 P， 事 实 上 ,这 样 的 技术 已 用 于 解 (68. 了 )， 
相应 的 技术 已 用 于 解 (68.2)、 它 们 是 数值 稳定 的 ， 并 且 有 一 个 优 
点 是 用 同一 个 程序 来 解 B 和 P 的 特征 值 问题 ， 但 是 工作 其 是 相当 
大 的 . 

69. 下 述 的 方法 数值 上 更 加 稳定 ,工作 量 节 省 很 多 。 现 在 我 们 
考虑 形式 (68.2)。 如 果 B 是 正定 的 ,通过 Cholesky 分 解 ,我 们 有 

B=LL', (69.1) 
这 里 工 是 实 的 非 奇异 的 下 三 角 型 .因此 ,(68.2) 可 记 为 形式 
ALLT™* 一 Ax, (69.2) 


由 此 得 
{LTAL)LIx = ALix, (69.3) 
如 果 1 和 ?是 LT4L 的 特征 值 和 特征 向 量 , 1 和 〈(L7)-"y 就 是 
《68.2) 的 解 . 
我 们 知道 , B 的 Cholesky 分 解 是 十 分 稳定 的 ， 如 果 有 内 积累 
加 万 其 是 这 样 ， 此 外 ,全 部 运算 仅 需 要 于 如 个 乘法 ， 用 工 计算 
L74 时 ,我 们 可 以 充分 利用 对 称 性 ， 事 实 上 ,如 果 我 们 记 
F=AL, (69.4) 
G— LiF, 《69.5) 
那么 G 是 对 称 答 陈 L74L, 因 此 我 们 仅 需要 它 的 下 三 角形 部 分 . 现 
在 ,LT 是 上 三 角 型 ,因此 在 计算 G 的 下 三 角形 部 分 时 只 用 的 下 
三 角形 部 分 的 元 素 。 于 是 。 我 们 只 需要 从 (69.4) 计算 的 下 三 角 
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形 部 分 . 决定 这 个 下 三 角形 部 分 需要 二 吧 个 乘法 。 确定 G 的 下 三 


角形 部 分 时 有 二 四 个 村 法 ， 因此 ,从 4 和 3 得 到 G 权 和 个 条 


法 ! 如 果 全 部 有 关 的 运算 都 用 内 积累 加 ， 含 人 误差 的 总 的 影响 保 
持 在 很 低 的 水 平 。 

转向 等 式 (68.1) ,我 们 发 现 , 要 计算 (工人 4( 工 -07 并 且 涉 及 
解 三 角形 方程 组 ， 我 们 仍 可 在 全 部 有 关 的 运算 中 用 内 积累 加 并 且 
利用 最 后 的 矩阵 的 对 称 性 在 这 里 我 们 从 三 角形 方程 组 的 高 精度 
解 得 到 许多 好 处 . 

当 如 关于 求 逆 是 病态 时 ,对 于 矩阵 《4 一 28) ,这 个 过 程 本 身 
是 病态 的 ， 不 失 其 一 般 性 ,我 们 假定 [8 一 1, 那么 在 病态 情况 
下 ， 呈 ”47 比 1 4 和 大 得 多 .通常 ， 原 特征 问题 有 一 些 
“大 ”的 特征 信和 其 他 “正常 大 小 ”的 特征 值 ， 由 这 个 过 程 决定 的 
“正常 大 小 "的 部 分 是 不 准确 的 , 在 极端 的 情况 下 , B 有 > 重 零 特征 
值 ，det(4 一 28) 是 (z 一 7) 次 多 项 式 , 因而 (4 一 48) 有 > 
个 "无穷 "特征 值 . 不 过 ，(4 一 13) 的 有 界 特 征 值 对 于 4 和 8B 的 
摄 动 通常 是 不 敏感 的 ,但 它们 不 容易 被 确定 ,这 应 看 作 是 这 方法 的 
一 个 缺点 ， 如 果 B 被 对 角 化 ,由 于 D 有 ?个 零 元 素 , 那 么 计算 会 出 
现 一 个 类 似 的 困难 (更 进一步 的 说 明 见 本 章 附 注 )。 


数值 例子 


70. 在 表 12 中 ,我 们 说 明 L574L 和 工 -4( 工 ”7 的 计算 , 它 
们 是 对 应 于 同一 对 矩阵 4 和 8 的. 全 部 计算 采用 六 位 十 进位 有 内 
积累 加 运算 。 为 了 得 到 det(483 一 1417) 和 det(4 一 18) 的 堆 
点 ,我 们 需要 计算 对 称 矩 阵 LT4L 和 L™4(L™)" 的 特征 值 .一 
般 我 们 只 给 出 对 称 矩 阵 的 一 个 三 角形 部 分 ,一 个 鲍 外 是 矩阵 丈 一 
工 …4( 工 -7 这 个 矩阵 由 解 LW 一 Z 得 来 并 且 在 计算 下 的 第 
列 时 我 们 用 前 面 计算 的 值 wriywr arr-: 作为 wes ro， 
wr-ur。 在 这 两 部 分 计算 中 需要 的 工作 量 非 常 小 ， 为 了 便于 比较 ， 
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冲 垃 


4( 对 称 的 ) B 《对称 正定 的 ) 
0.935 0.613 0.217 0.4131 [0.983 0.165 0.213 0.122 
0-216 0.317 0.323 0.897 0-214 0.132 
0.514 0.441 0.903 0.213 
0.315 0.977- 
(其 中 BLL7) 下 一 ALC( 下 三 角形 郎 分 ) 


0.991464 0.166421 0.214834 0.123050]T1.126474 
0.932365 0.191177 0.119612|| 0.751562 0.300629 
0.905703 0.180741|| 0.432593 0.446574 0.545238 
0.956496- 0.596731 0.423141 0.456348 0.301296- 


G = LTF 一 L74L( 对 称 的 》 2 mL AKC 上 三 角形 部 分 ) 
1.408298 0.943050 0.618278 0.218868 0.416556: 
0.854808 0.416283 0.121310 0.300929 0.272078 
0.499655 0,480942 0.376304 0. 452079 0.330676 
-0.5707?1 0.404733 0.436495 0.288188 0.179229 


罗 一 过 一 上 MACL -DT( 对 称 的 ) 
0-951169 0.493351 一 0.088100 0.268090 
0.493351 0.042050 0.206361 0.176732 

一 0.088100 0.206361 0,476486 0.241206 
0.268090 0.176732 。 0.241206 0.085213 


我 们 用 相当 高 的 精 罕 计算 短 阵 LT4L 和 工 -4(L DT， 在 给 出 
的 LTAL 的 元 素 中 最 大 误差 是 10“*(2.04), 它 仅 在 一 个 元 素 中 发 
生 ， 它 是 特别 不 利 的 舍 人 的 结果 。 所 有 其 他 元 素 的 误差 都 小 于 
10*， 在 计算 的 L*4(L™)T 的 任何 元 素 中 , 最 大 误差 县 
107(0.98)， 这 些 结果 表明 ,这 两 个 过 程 的 数值 稳定 性 极 好 。 


同时 简化 4 和 怠 为 对 角 弄 
71. 从 特征 问题 
Ar 一 1Bz (710 
的 解 我 们 可 以 导出 非 奇 异 的 矩阵 X ,使 得 
XIAX 一 diag(2)，XTBX 一 了。 (71.2) 
事实 上 ,研究 等 价 的 对 称 特征 问题 
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LA(lL Ty 一 Ay {71.3) 
并 且 令 闷 ,为 ，…y。 是 特征 向 晤 的 正 交 组 。 于 是 我 们 有 


YrY 一 了 《71.4) 
和 
4(L-Dry 一 了 diag(1)， 《71.5) 
如 果 我 们 用 关系 
Y=LiX 《71.6) 
定义 XX, 那 么 X 是 非 奇 异 的 ,并 且 (71.4) 变 为 
XLLT™X = 1, 即 XrBX = 1, (71.7) 
另 一 方面 用 Y7 左 乘 (71.5), 我 们 得 到 
KIAX 一 diag(2r)。 (71.8) 
三 对 角 乱 阵 有 A 和 BB 


72. 当 4 和 好 都 是 三 对 和 角 矩 阵 时 ,我 们 已 讨论 的 解 4x 一 48x 
的 方法 是 没有 吸引 力 的 。 因 为 一 般 来 说 ，L~'4(L™)7 是 满 矩阵 。 
这 个 问题 可 以 用 与 $39 使 用 的 类 似 的 方法 求解 。 我 们 先 来 证 明 下 
面 一 个 简单 的 引 理 . 

设 4 和 了 是 对 称 妊 阵 , 8 是 正定 第 阵 ,那么 det(4, 一 1B,) 的 
雪上 分隔 dct(4rn 一 1 已 sn) 的 等 吉英 电 人 和 B, 素 示 i 除 的 
南 主子 失 降 


我 们 注意 到 , 如 果 
y 一 工 rz (72.1) 


JOY xds Ax 
yy ziLiixr xrBr?” 
并 且 方 程 (72.1) 给 出 非 零 * 和 y 的 一 一 对 应 关系 ,因此 ,对 于 非 零 
的 * 应 用 极 小 - 极 大 定义 于 比值 ?4zx/xTBx 就 给 出 det(4 一 48) 
的 零点 (参见 第 二 章 $43)。 现 在 我 们 可 以 用 第 二 章 $47 的 方法 证 
上 明 det(4, 一 48,) 的 零点 分 隔 定理 。 因 此 , 如果 我 们 记 


Gi = Ga Qirt Pitis bi 


(72.2) 
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一 (72.3) 
那么 定义 为 


PD 1, PAM) = 0 — Mo, 
名) 一 (or 一 ar) pr (2) — (Br 一 Hp) Pes) 


的 多 项 式 形成 一 个 Sturm 序列 , 并 且 我 们 可 以 用 $39 的 分 半 方 法 
寻找 ph(2) 的 零点 ， 另 外 ,我 们 可 以 像 547 那样 把 有 交换 的 Gauss 
消去 法 应 用 于 三 对 角 和 矩阵 〈4 一 18) 去 确定 det(4, 一 48,) (r 
一 1,2,……,?) 的 符号 。 随 着 问题 的 简化 我 们 不 必 一 直 采 用 分 半 
方法 , 当 零点 已 被 孤立 时, 我们 可 以 改 用 某 些 二 次 收敛 的 方法 导 求 
Pa(4) 一 det(4 一 18) 的 零点 。 

为 了 从 一 个 好 的 特征 信 计 算 特 征 向 量 ， 逆 选 代 法 需要 求解 方 


(72.4) 


程 
(A — 1B)rm = ys (72.5) 
yrs = Brrr (72.6) 
因为 这 些 方 程 意味 着 
[LTACL™T)T — XLirn = Lizr,, {72.7) 


我 们 仍然 预料 两 次 迭代 一 般 是 足够 的 ， 
这 些 技术 充分 利用 了 4 和 8 的 三 对 角形 的 特点 。 


复 Hermite 矩阵 


73. 我 们 已 经 描述 的 关于 实 对 称 矩 阵 的 技术 ,在 揽 Hermite 逢 
人 阵 的 情形 有 完全 平行 的 方法 ， 对 于 Jacobi 方法 ，Givens 方法 和 
对 于 Househalder 方法 ,我 们 分 别 需 要 用 第 一 章 $43 ~ 844 和 $45 
~$46 的 复 西 矩阵 。 $29 使 用 的 公式 的 最 自然 推广 给 出 一 个 方法 ， 
这 个 方法 决定 每 一 个 初等 Hermite 矩阵 需要 两 次 平方 根 运算 . 一 
个 微小 的 修 尺 可 以 减少 一 次 平方 根 运算 。 用 $29 的 记号 我 们 现在 
有 
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Pm — un/2K?, wr — 1 (f=1,2,.*,+), 
的 tr ™ ortil + HT), ui = asi =r + 2 0), 
So Dab, To Cenal's)t, 
2 一 3 + i, 
(73.1) 
这 里 我 们 已 选用 了 稳定 的 符号 。 

三 个 方法 中 不 管 我 们 使 用 的 是 那 一 个 ,矩阵 一 直 保持 Hermite 
型 ，Jacobi 方法 最 终 给 出 的 是 实 对 角 甜 阵 ,而 从 第 一 章 $44, 可 以 
证 明 : Givens 方法 给 出 一 个 实 三 对 角 矩 阵 、Householder 方法 给 
出 的 是 三 对 角 Hermite 矩阵 C， 通 常 ,其 非 对 角 线 元 素 是 复 的 。 
这 可 从 第 一 章 546 开头 的 说 明 得 出 。 我们 有 


Ci = Gi( 实 ), Gisn 8 ctr 一 而 {73.2) 
因此 ， 
Sap Cr = (Bnd ( 实 ). (73.3) 
这 涪 明 Pi 是 复数 不 是 十 分 重要 的 。 


奇怪 的 是 ,它们 在 理论 物理 中 是 很 重要 的 ,但 我 们 几乎 没有 下 
到 复 Hermite 矩阵 的 例子 , 我 们 没有 编写 复 的 程序 版 本 、 正 如 第 
三 章 $56 所 指出 ， 复 Hermite 矩阵 《〈B 十 iC) 的 特征 信 问 题 可 


以 化 为 实 对 称 矩阵 4 的 问题 , 4 定义 为 
了 一 B 一 | 
[c gs {73.4) 


在 ACE 和 DEUCE 上 我 们 已 经 这 样 做 了 ,我 们 知道 ，4 的 特征 
值 是 ,4 为 ,为 ,… ,4 4s， 因此 我 们 仅 需 要 找 从 4 导出 的 三 对 
角 和 矩阵 的 第 1,3,…,24 一 工 个 特征 值 ， 出 现 重 特征 值 不 影响 它们 
的 精确 度 ， 在 对 应 每 一 对 二 重 特 征 值 的 特征 向 量子 空间 中 我 们 仅 
需 找 一 个 特征 向 量 。 在 这 个 子 空 间 中 ， 所 有 向 量 都 对 应 4 的 同一 
个 复 特征 向 量 。 由 Givens 方法 或 Househetder 方法 导出 的 三 对 
角 矩 阵 应 该 分 为 二 个 息 等 的 矩阵 、 但 是 在 实际 计算 中 可 能 不 是 这 
样 。 
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可 是 矩 降 双 需要 的 存储 量 是 (8 十 iC) 的 两 众 , 又 因为 在 
Givens 和 Householder 的 简化 中 的 乘法 量 与 阶 数 立 方 成 正比 ,所 
以 需要 的 乘法 量 是 简化 (8 十 iC) 的 复 乘法 量 的 八 倍 。 因为 一 
个 复 乘法 包含 四 个 实 冬 法 ,用 同样 的 方法 (8B 十 iC) 的 简化 工作 量 
仅仅 是 4 的 一 半 。 在 Givens 简化 中 每 一 个 平面 旋转 除了 平面 是 
G5i 十 1) 之 外 四 个 特殊 元 素 中 的 两 个 是 实 的 , 如 果 我 们 利用 这 个 


特点 ,在 (8 十 iC) 的 简化 中 民法 量 可 进一步 缩 碱 为 原来 的 过， 候 


如 我 们 需要 作 很 大 量 的 这 种 计算 并 且 气 阵 很 大 ， 存 储量 的 问题 变 
得 突出 的 话 ， 那 么 我 们 用 比较 麻烦 的 复 程序 才 会 变 得 十 分 有 利 . 
跨 注 

虽然 早 在 1947 年 在 National Physical Laboratory 的 台式 计算 
机 上 已 使 用 Jacobi 方法 ,但 是 当前 对 它 的 兴趣 是 从 1949 年 Gold- 
stinge，Murray 和 Von Neumann 的 重新 发 现 开 始 的 。 Jacobi 方法 
能 把 一 个 数 覆 盖 在 另 一 个 数 上 面 ， 这 使 得 它 在 高 速 计算 机 上 十 分 
阴 引 人 。 人 了 从 1949 年 以 来 ， 这 个 方法 在 文献 中 已 受到 广泛 的 介绍 、 
我 们 介绍 以 下 著者 的 论文 ; Goldstioe，Murray 和 Von Neumann 
《1959)，Gregory (1953), Henrici (1958a), Pope 和 Tomkins 
(1957), Schsnhage (1961) 和 Wilkinson (1962c)。 Goldstine 等 
人 的 论文 给 由 这 个 方法 的 误差 分 析 , 虽然 论文 直至 1959 年 才 公开 
发 表 ,但 是 大 量 的 工作 是 在 1951 年 前 完成 的 。 

尽管 Givens (1954) 给 出 了 他 的 方法 的 严格 的 先 验 误差 分 
六, 在 我 看 来 这 是 本 主题 的 历史 上 一 个 里 程 碑 , 但 是 对 于 特征 值 的 
确定 来 说 ， Givens 方法 通常 优越 于 Jacobi 方法 这 个 事实 很 晚 才 
得 到 公认 。 也许 因 为 人 们 曾 发 现 所 提出 的 方法 计算 的 特征 向 量 不 
可 靠 , 它 引 起 人 们 对 于 计算 的 特征 值 精度 产生 不 必要 的 猜疑 . 

Houscholder 于 1958 年 在 Urbana 的 演讲 中 首先 提出 用 初等 
Hermite 矩阵 约 化 矩阵 为 三 对 角 型 ,并 且 在 1959 年 与 Bauer 合作 
的 论文 中 再 次 简要 地 指出 它 。 Wilkinson 《1960a) 首先 认识 这 个 
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方法 无 沦 在 速 罕 上 或 是 在 精度 上 都 比 Givens 方法 好 ,定点 运算 
的 误差 分 析 由 Wilkinson (1962b) 给 出 ，Ortega 《1963) 给 出 了 
浮 点 的 误差 分 析 . 

Givens〔〈 见 本 节 引 用 处 ) 描述 了 用 Srurm 序列 性 质 计算 三 对 
角 答 阵 的 特征 值 并 给 出 了 误差 分 析 。 这 个 分 析 已 应 用 于 有 特别 的 
比例 因子 的 定点 计算 ， 并 且 这 是 我 们 现在 称 为 “向 后 误差 分 析 " 的 
第 一 个 工作 , 员 然 这 个 思想 早已 隐 含 在 Von Neumann 和 Goldstine 
《1947) 和 Turing (1948) 的 论文 中 。 

已 经 知道 较 精确 的 特征 值 时 ， 三 对 角 和 矩阵 的 特征 向 量 计算 问 
题 已 经 由 Brooker 和 Sumner (1956)，Rorsythe (1958)，Wilki- 
nson〔1958a) 研究 过 ,还 有 Lanczos 在 Rosser 等 《1951) 的 论文 
中 也 讨论 过 .就 “明显 分 离 ” 的 特征 值 来 说 ， 逆 迭代 给 出 这 个 问题 
令 人 十 分 满意 的 解 ， 在 对 应 重 特征 什 或 非常 洁 近 的 特征 值 的 特征 
向 量 所 张 成 的 子 空间 内 ， 确 定 可 靠 的 完全 的 数字 信息 这 个 问题 还 
没 一 个 满意 的 解决 办 法 。 决定 Hessenberg 和 拖 阵 的 特征 向 量 也 是 
一 个 类 似 的 重要 问题 ,我 们 将 在 第 九 章 讨论 . 

车 B 关 于 求 逆 是 病态 的 ，(4 一 48) 的 特征 问题 解法 是 比较 
差 的 ， 即 使 了 是 奇异 矩阵 ，(4 一 148》 的 有 限 特征 信 是 “好 确定 ” 
的 ,我 们 用 下 述 例子 来 说 明 这 个 事实 ， 设 


“1 2s- 


我 们 有 det(4 一 48) 一 3 一 2 因而 特征 值 是 1 二 和 oo, 在 4, 如 


上 的 小 变动 只 使 有 限 特征 值 发 生 小 的 改变 ， 但 无 穷 特征 值 却 变 成 
有 限 的 ,虽然 它 是 十 分 大 . 

如 果 4 是 良 态 的 并 且 是 正定 或 负 定 的 。 我 们 可 以 分 别 对 〈 召 
一 7) 或 (一 8 一 4( 一 4)) 进行 计算 .可 异 我 们 并 不 总 能 事先 知 
道 4 或 引 是 否 病态 ， 虽 然 在 统计 学 和 理论 牺 丙 学 中 几乎 能 保证 了 
是 良 杰 的 。 

对 于 和 矩阵 是 病态 的 情况 $68 的 方法 有 一 定 的 优点 ， 因 为 3 的 
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“全 部 病态 "都 集中 在 的 小 元 素 上 .(68.5) 的 矩阵 己 有 一 定数 量 
的 行列 的 大 元 素 (对 应 于 小 的 di) ,以 及 《4 一 13) 的 正常 大 小 
的 特征 值 。 这 些 性 质 很 可 能 保持 下 来 ， 
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六 章 ”化 一 般 矩阵 为 压缩 型 
引言 


1. 现在 我 们 讨论 一 个 比较 困难 的 问题 ,计算 一 般 拔 阵 如 的 特 
征 系 。 对 于 这 个 问题 , 我 们 不 能 期 望 对 比较 精确 的 结果 有 预先 的 
保证 ,但 是 我 们 预料 稳定 的 变换 产生 的 矩阵 准确 地 与 矩阵 (4 十 
互 ) 相似 ,并 且 能 够 建立 EB 的 满意 的 界 。 

本 章 的 前 半 部 分 研究 用 初等 相似 变换 化 4 为 和 csenberg 型 


《第 四 章 $33)。 虽然 一 般 来 说 ;一 个 Hescnberg 知 阵 有 二 nn-+1) 


下 非 零 元 素 ,与 满 矩 阵 相 比 , 被 压缩 的 元 素 还 不 到 一 半 ， 但 是 这 个 
结果 使 得 特征 问题 大 为 简化 .我 们 研究 的 每 一 种 方法 都 有 两 个 变 
型 , 它们 分 别 导 出 上 了 essenperg 型 和 下 Hessenberg 型 。 从 后 面 
的 应 用 来 看 ,上 Hessenberg 型 更 方便 一 些 ， 因 此 我 们 以 后 将 讨论 
适用 于 这 种 形式 的 方法 。 

使 用 这 种 形式 的 撼 阵 带 来 稍 有 遗憾 的 后 果 ， 因 为 我 们 习惯 用 
拢 阵 的 上 三 角 部 分 元 素来 描述 对 称 矩 阵 的 有 关 技 术 ， 因 此 也 在 这 
上 三 角 部 分 引 人 替 元 素 。 在 第 五 章 我 们 已 保持 这 个 习惯 当然， 
根据 对 称 性 , 零 元 素 会 同时 在 下 三 角 部 分 引 人 , ) 虽然 我 们 改 用 下 
Hessenberg 型 是 很 容易 的 事情 ,但 是 我 们 决定 用 上 Hessenberg 型 
这 使 得 对 称 和 矩阵 的 技术 与 非 对 称 矩 阵 的 技术 这 商 者 之 间 的 比较 不 
如 用 下 Hessenberg 型 那样 直接 了 当 。 

本 章 下 半 部 分 研究 从 Hessenberg 型 进一步 化 为 三 对 第 型 和 
Frobeoius 型 .这些 压 缩 型 的 特征 信 问 题 留 在 第 七 章 叙述 。 


Givens 方法 
2。 我 们 首先 考虑 把 第 五 章 描述 过 的 Givens 和 Householder 
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方法 照搬 过 来 。 现 在 Givens 约 化 过 程 有 (sn 一 2》 步 。 在 第 * 步 
开始 之 前 , 4 的 前 (r 一 1) 列 已 被 化 为 上 Hessenberg 型 ,x 一 6， 
r 一 3 的 例子 是 


XXiXx XXX 
x xlxxXX 

一- 
0 xxXXX 

| (0D 
00|xx xx|* 一 
oo1xxxx|<* 一 
001x x x x|* 一 


实际 上 我们 可 以 说 它 的 + 阶 前 主子 炬 阵 已 经 是 Hessenberg 
型 ， 并 且 它 在 以 后 的 各 步 约 化 中 不 再 发 生变 化 . 
第 + 步 由 (s 一 r 一 1) 小 步 组 成 ,它们 在 第 r 列 的 + 十 2。 
7 士 3……:?# 位 置 上 引信 零 元 素 。 (7 十 1, 站 平面 上 的 旋转 引信 
第 ;位 置 的 零 元 素 。 在 (2.1) 中 下 面 加 横 线 的 元 素 是 要 消去 的 ， 科 
头 指 示 的 是 受 影响 的 行 和 列 。 我 们 可 以 用 通常 的 算法 语言 拱 述 第 
7 步 如 下 : 
对 于 i 从 r 十 2 到 # 执 行 下 述 (人 至 (iv) 各 步 。 
人 计算 “一 (aaar 十 a) 
全 ) 计算 cosg 一 aaarjz*。sing 一 ow/x (如 果 一 0 
令 eosg 一 1，sing 一 0, 并 略 去 〈ii)，(iv) 步 ), 把 * 覆盖 在 aur 
上 ,把 er 改 为 零 . 
( 才 ) 对 于 从 > 十 1 到 = 执行 。 
计算 ctucosg 十 sising 和 一 ertuisin8 -+ aricosg, 把 
它们 分 别 覆 盖 在 ariv 和 ar 上 。 
(iv 对 于 j 了 从 1 到 # 执 行 。 
计算 ajwncos6 十 aiising 和 一 artisin9 十 eicosg, 把 
它们 分 别 复 盖 在 ow+t 和 er 上。 
其 中 (二) 的 含义 是 左 沫 ，(iy) 是 用 (+ 十 1, ) 平面 上 的 孝 
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转 右 鞠 。 这 个 变换 应 与 第 五 章 $22 的 对 称 情况 比较 , 我 们 可 以 看 
出 ,因为 这 里 没有 对 称 性 , 所 以 行 、 列 都 要 作 变 换 。 基 本 的 乘法 量 
是 
Sirs 一， 一 中 二 24 一 一 2 
(2.2) 
在 对 称 的 情况 下 ,本 法 量 只 是 和 攻 。 注意 ， 在 位 置 (i,r) 引进 零 


元 和 在 位 置 (r, i) 引 人 零 元 没有 关系 。 因 此 ， 现 在 化 为 零 的 元 素 
所 占 的 位 置 不 足以 存储 cos 和 sin9 两 个 值 。 一 个 数值 稳定 的 又 
节省 存储 单元 的 方案 是 : 存储 cos6 和 sin6 中 模 较 小 的 一 个 , 并 
用 最 后 两 个 有 效 数字 表明 存 的 是 cos6 还 是 sn8 以 及 另 一 个 的 符 
号 。 


Householder 方法 

3。 对 于 一 般 和 矩阵, 我 们 同样 有 第 五 章 撕 述 的 Houscholder 方 
法 的 自然 推广 。 现 在 它 也 是 由 (s 一 2) 步 组 成 在 第 r 步 开 始 之 
前 ,4。 已 化 为 某 个 形状 。 以 = 一 6, 7 一 3 为 例 , 它 是 


(3.1) 
矩阵 太 ,-s 是 上 Hesseaberg 型 。 上 述 形式 与 Givens 方法 第 了 步 
开始 时 的 形式 一 样 ， 但 是 我 们 已 划分 4 这 是 为 了 说 明 第 7 次 
变换 的 影响 ， 变 换 和 矩阵 只 的 形状 可 以 表示 为 


于 
已 一 


I!10 Iio 
2 | -= | | (3.2) 
2019 O11- 207 
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其 中 二 是 一 个 (a 一 +) 维 规格 化 铅 量 。 由 此 我 们 有 
了 Hi 1C.0, 


A = PAP, ~ -一 
af 


一 G3) 
Olc, (19,B..0, 
其 中 c 一 85， 如 果 我 们 选取 v, 使 得 C, 的 元 素 除了 第 一 个 
以 外 全 为 零 ,4, 的 (+ 十 1) 阶 前 主子 矩阵 是 Hessenberg 型 . 
仍然 像 第 五 章 $29 一 样 , 如 果 我 们 使 用 矩阵 已 一 工 一 2w,w? 
来 讨论 ,公式 最 简单 ， 其 中 w, 是 ” 维 规 格 化 向 量 ， 其 前 了 个 分 量 
是 零 . 我 们 有 
P= 1— 2ww = 1 — uu/2K:, (3.4) 


其 中 


sr 0 (i 1,2,..7), 


tr Gtr TS, Wi a (fr +2, 1), 


“ 3.5) 
5 = (> 2 2K! 一 5! TF ars,. 
名 
(3.5) 的 sr 表示 4 的 (i, 门 元 素 . 新 的 《〈r 十 1, r) 元 素 是 
土 % .符号 是 按 通 常 的 方式 选 定 的 . 
4. 我们 现在 没有 对 称 性 可 以 利用 ,因此 要 分 别 考虑 用 P, 左 条 
和 右 乘 。 对 于 左 乘 ,我 们 有 
PAr= (I— wa {2K? A 
= A wna IR = Fs; 4) 


对 于 右 乘 ,我 们 有 
A, = PArsb, = FP, = FAl ~ uu! {2K?) 
= F,— (Prur)ur /2K?, (4.2) 
我 们 清楚 地 看 到 ,因为 w 的 前 ”个 元 素 都 是 零 ， 所 以 用 品 左 乘 的 
结果 。4,-: 的 前 ” 行 不 变 ， 得 到 的 F, 用 P, 右 乘 后 前 7 列 保持 不 
变 。 
我 们 可 以 写 


Ar Pr, 《4.3) 
4 和 丘 的 零 元 素 使 得 pr 的 前 (7 一 1) 个 元 素 是 零 ， 由 此 我 们 
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得 到 

Frm A — (uf2K? )pr. (4.4) 
我 们 不 必 计 算 p, 的 第 7 个 元 素 , 因 为 这 仅仅 影响 F, 的 第 > 列 , 我 
们 已 知 这 一 列 的 前 “个 元 素 就 是 4,-: 的 对 应 元 素 ,其 余 的 元 素 形 
成 向 量 c,。 变 换 的 目的 是 使 C, 的 元 素 除 第 一 个 是 土 5, 之 外 全 为 
零 ， 因 此, 计算 p, 的 (n 一 ”) 个 元 素 只 需要 (s 一 人 次 乘法 , 由 
《4.4) 计 算 已. 需要 另外 的 (” 一 +) 次 乘法 . 

关于 右 溢 ,我 们 写 


Fu 一 9 《4.5) 
其 中 向 量 4, 没有 零 元 素 。 因为 w 的 前 个 分 量 是 霍 ， 所 以 在 4 
的 计算 中 包含 nln 一 1) 次 乘法 。 最 后 我 们 有 
A F,— glu/2Ki ), (4.6) 
这 又 需要 作 xz 一 >) 次 乘法 .值得 注意 的 是 ,虽然 在 计算 F, 时 
要 用 本 身 ,因为 我 们 必须 导出 Fw， 但 是 在 (4.47 和 (4.6) 中 却 都 
要 用 向 量 wj/2E&? 。 如 果 我 们 用 w,， 这 个 困难 就 可 以 避免 ,但 是 要 
耗费 2K; 的 平方 根 运算 ， 
如 果 我 们 把 矩阵 存储 在 外 部 存储 设备 中 ， 又 希望 节省 传送 时 
间 ， 下 面 的 方案 大 概 是 最 方便 的 。 我 们 用 下 述 关系 式 定义 商量 
好 9r9 vr 和 纯 量 ww; 
Pwd ga vw/2Ki, plv— a 
{4.7) 
然后 从 下 式 计算 41。 
4 一 4 一 0 一 9 
= A vp (gq, 一 oarje (4.8) 
上 述 公式 与 第 五 章 $29 ~ $30 的 关于 对 称 矩 阵 的 公式 比较 接近 ,但 
是 现在 w,(w? 4,-awr)x77(2K2 ) 这 一 项 不 能 并 到 其 他 两 项 中 去 
了 . 
用 上 述 的 任何 一 种 变型 完成 整个 约 化 过 程 的 总 乘法 量 实质 上 
是 
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D2 r+ Dann 一 >) ~ 2 十 彤 一 三 中 (4.9) 


在 对 称 的 情况 下 ，。Householder 方法 的 总 对 法 量 是 二 mw。 我 
们 又 发 现 Householder 方法 的 腿 法 量 只 是 Givens 方法 的 一 半 。 


存储 方案 的 研究 


5. Householder 变换 的 存储 十 分 方便 ,zw 有 zx 一 r 个 非 老 元素 ， 
而 相应 的 变换 只 产生 (n 一 + 一 1) 个 零 元 素 , 因 此 原 和 矩阵 点 有 的 
空间 不 足以 存储 所 有 的 信息 。 但 是 我 们 发 现 Hessenberg 型 的 下 
次 对 角 线 元 素 在 以 后 的 运算 中 起 着 特殊 的 作用 ， 如 果 用 一 个 能 存 
(xn 一 1) 个 元 素 的 一 维 数组 单独 存储 它们 ， 运 算 将 会 十 分 方便 。 
注意 ，wr 一 az 企 一 了 十 2 9)， 因此 除了 wsrsr 以 外 所 有 非 
零 元 素 已 经 存储 在 适当 的 位 置 上 了 1! 以 = 一 6, ”一 3 为 例 , 第 7 
步 结 束 时 的 单元 分 配 情况 如 下 : 


Ba hy bys hu a1s a1s 
Ua hn hrs hy G1 4% 
ty tsa hss yy Ays G36 
sa wa He hn a an |? 5D 
Hs Hsa Wy3 Gy4 055 G5 


Wal Us Usy Hes Ges 66 


其 中 后 是 最 后 的 Hessenberg 型 的 元 素 ，“z 是 当前 4, 的 元 素 。 
此 外 ,我 们 用 ”个 单元 存放 下 述 向 重 。 

[aa br 《Costnttrrars va tm) 2 1 (5.2) 
在 一 全 有 两 级 存储 设备 的 计算 机 上 还 需要 另外 ”个 单元 存放 向 
量 包 以 及 4"; 这 些 向 量 不 是 同时 需要 的 ,如 果 只 用 内 部 存储 器 ,我 
们 不 需要 存 这 些 向 量 ,因为 用 到 公式 (4.4) 和 (4.6) 时 , p, 和 4, 的 每 
一 个 分 量 计算 出 来 就 可 立即 使 用 。 计算 83 ,PF 和 g, 时 ,可 以 用 
内 积累 加 。 
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误差 分 析 


6. 第 三 章 的 一 般 性 分 析 可 以 用 来 证 明 无 论 Givens 约 化 ,或 
者 Houscholder 约 化 ,最 终 计算 的 Hessenherg 和 矩阵 旷 是 准确 相似 


于 (4 十 EE) 的 ,并 


t 且 能 给 出 的 界 。 关 于 


F 对 称 滤 阵 的 情况 ,分 析 


确实 比较 简单 ， 但 是 非 对 称 情况 的 分 析 并 不 比 对 称 的 情况 来 得 困 


难 . 在 表 1 中 ,我 们 概括 了 已 得 的 结果 。 无 论 是 哪 一 种 情况 ,简化 
《4 十 瑟 ) 为 如 的 相似 变换 矩阵 是 对 应 于 计算 的 4, 的 准确 正 交 逢 
阵 的 准确 乘积 ， 
表 1 

方 法 计算 方式 4 的 初始 平衡 互 的 界 
Givens 定点 (fi) | N41 ~ Ki EISK 2 
Givens 定点 C5) | los 过 1 一 Kee | Be 人 SK 
Houscholder | 定点 Ci) 1 一 Rn | 1RhSK,2 a 
Householder | 定点 (i) lls< 寺 - Ks- | ElgRK2 tn 
Householder | 定点 Ci) 141s 二 一 Rm | ERK- 
Givens 浮 点 CD 不 必要 HBleKa mt Aols 
Hovseholder | 浮 点 CD 不 必要 [TS 
Householder | 浮 点 C11,》 不 必 时 Eg Ke2 nl Ao 


其 中 KK, 的 数量 级 是 1。 就 前 面 的 两 个 界 而 言 , 用 攻 代 兰 i, 产生 
的 影响 只 涉及 常数 K; 和 KK,。 

在 定点 计算 中 ,为 了 保证 所 有 中 间 数 字 都 不 超出 允许 范围 ,我 
们 必须 事先 引 人 比 例 因 子 ， 当 已 确定 时 ,我 们 给 出 了 zj 和 


HElls 的 界 ; 对 应 了 


FElls 的 界 ， 我 们 给 出 


了 4ole 的 许可 范围 的 


界 ， 虽 然 4 的 界 的 限制 小 , 但 是 足以 用 来 训 免 煞 字 超过 限度 。 
可 是 实际 上 ||4olls 的 界 容易 计算 ,而 4; 是 比较 难 定 的 。 
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用 浮 点 运算 时 , Ells 的 每 一 个 界 都 应 该 有 形 如 (1 十 
天 2 的 附加 因子 , 它 随 着 增加 趋向 无 穷 ， 但 是 在 上 述 方 
法 的 应 用 范围 内 , 它 的 值 总 是 接近 1, 因此 可 以 格 去 . 

这 些 结果 表明 ， 当 4 是 良 态 的 矩阵 ， 表 1 列 出 的 每 一 个 方法 
几乎 都 受 存储 晤 或 运算 时 间 的 限制 ,而 不 存在 精确 度 方面 的 问题 . 
当然 ， 我 们 可 以 构造 某 个 4， 其 病态 度 非常 高 使 得 尽管 互 的 界 很 
小 ,但 都 不 足以 保证 特征 信 达 到 所 锅 的 精度 . 


Givens 方法 与 Householder 方法 的 关系 


7. Givens 方法 和 Householder 方法 都 是 用 正 交 相似 变换 化 
4 为 上 Hesscnberg 型 。 现 在 我 们 证 明 两 个 变换 矩阵 ， 如 果 不 考 
虑 各 列 的 土 1 因子 ,它们 是 恒 等 的 。 首 先 ,我 们 证 明 一 个 更 一 般 的 
定理 ,以 后 我 们 还 要 引用 它 . 

如 果 49. 一 9 号 和 49; 一 9,8,,9; 是 本 矩阵 ,HH 是 上 Hes- 


Qi— QOD, H,= DD, (7.1) 
关中 了 是 对 钊 间 ,对 旬 线 元 素 的 太吉 是 1， 我 们 仅 多 证 明 如 果 
A0= QH {7.2) 


并 且 给 定 8 的 第 一 列 , 那么 8 和 二 在 本 质 上 是 唯一 确定 的 。 证 明 
如 下 ; 
《7.2) 两 边 的 第 一 列 相等 ,我 们 有 


49: 一 hq 十 hngy, {7.3) 
因为 9 是 西 矩 阵 , 我 们 得 到 
hu— 9EAq, haq; = Aqi — hugr (7.4) 
第 一 个 方程 给 出 有, 第 二 个 方程 给 出 
Whal = 4g 一 hugslls, (7.5) 


因此 ,我 们 可 以 确定 9,, 但 差 一 个 因子 , 比如 说 是 e+。(7.2) 式 两 
边 的 第 二 列 相 等 导出 

49; 一 bugs 十 hugs + hsqss (7.6) 
因此 
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BAG, ja AN bygs Ags 一 hg: 一 7209)。 
{7.7) 
前 两 个 方程 给 出 和, 第 三 个 方程 给 定 
1 = Ag 一 hags 一 #9 {7.8) 
容易 验证 | 如 | 与 因子 无 关 。 因 此 , 我 们 可 以 确定 9 只 差 一 
个 因子 , 比如 说 ,是 ce 名 继续 这 样 分 析 下 去 ， 我 们 可 籍 是 确定 
的 , 只 差 右 莱 一 个 因子 D, 即 diag(e 沪 ), 这 个 自由 度 正 是 《7.1) 
中 的 不 确定 性 . 
值得 注意 的 是 ， 如 果 我 们 规定 tot 是 正 实数 ， 8 和 已 就 由 
2 的 第 一 列 唯 一 确定 。 上 述 证 明 下 到 hiwi,; 为 零 时 不 能 继续 ， 因 
为 这 时 gns 可 以 是 正 交 于 qi 9 9; 的 任何 单位 向 量 - 
现在 我 们 只 要 注意 Givens 方法 和 Householder 方法 的 变换 
矩阵 第 一 列 都 是 c,, 就 得 到 这 两 个 方法 的 等 价 狂 。 这 是 因为 ,在 
Givens 方法 中 不 包含 第 一 个 平面 的 旋转 , 而 在 Householder 方法 
中 所 有 商量 w' 的 第 一 个 元 素 都 是 零 。 对 称 的 Givens 方法 和 
Householder 方法 的 等 价 性 当然 是 上 述 情况 的 特例 。 这 个 证 明 应 
该 和 第 四 章 853 的 对 照 。 我 们 再 次 羡 重 指出 。 虽然 Givens 和 
Householder 方法 整个 变换 本 质 上 相同 ,但 是 使 得 第 * 列 产生 零 元 
索 的 矩阵 是 不 同 的 。 证 明 方 法 与 第 四 章 $53 的 几乎 相同 。 
尽管 这 两 个 变换 理论 上 等 价 并 且 都 是 “稳定 ”的 ,但 在 实际 计 
算 中 , 舍 人 误差 使 它们 可 以 完全 不 同 。 这 个 现象 是 不 足 为 奇 的 , 因 
为 第 五 章 $28 描述 过 ， 甚 鞋 以 稍 有 不 同 的 运算 精度 把 Givens 变 
换 两 次 用 于 同一 个 矩阵 , 我 们 得 到 两 个 相差 很 大 的 三 对 角 型 ， 在 
那里 我 们 看 到 ,假如 在 任何 一 步 中 所 有 要 消去 的 元 素 都 是 小 的 ,两 
个 计算 的 差别 就 会 发 生 ， 注意 ,出 (7.5) 和 (7.8) 元 素 如 tui 就 是 这 
样 元 素 的 平方 和 的 平方 根 , 而 且 我 们 上 面 已 经 说 明 , 当 和 tsw 是 零 
时 , 关系 式 40 一 9H 不 能 唯一 确定 8。 当 某 个 firuz 是 零 时 ， 
准确 变换 的 不 瞧 一 性 导致 当 名 ws 小 时 变换 的 “ 劣 ”定性 。 我 们 
再 次 闭 重 指出 ， 最 后 结果 的 精度 决 不 会 因为 变换 的 劣 定性 而 受 影 
响 ， 
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初等 稳定 变换 


8. 对 于 对 称 逢 阵 ， 用 正 交 变换 的 好 处 很 多 , 我 们 没有 考 虐 用 
比较 简单 的 初等 稳定 变换 ,但 是 现在 的 情况 很 不 相同 。 
我 们 研究 用 N; 型 〈 第 三 章 $47) 初等 稳定 第 阵 化 de 为 上 
Hessenberg 型 , 它 由 (n 一 2) 步 组 成 ,第 7 步 开始 之 前 4o 已 变 为 
4r-u 以 4 一 6,+ 一 3 为 例 表示 如 下 。 
hy hy bys dy Qs 1g 
ha bay hn on ds Ay 
0 hs fag ga Ga Gg , (8.1) 
0 0 gn au G4 de 
0 0 gan a dy dy 
0 0 gn du G85 96 
我 们 将 君 到 以 后 的 各 步 不 影响 元 素 hi, 第 7 步 可 以 表示 如 下 。 
(i) 决定 量 jarlG 一 十 1; ,2) 的 极 大 值 。〈 当 它 不 唯 
一 时 ， 取 其 中 第 一 个 . ) 若 这 个 元 素 是 eurbrw; 交换 第 7 十 1 行 各 
第 (r 十 1 行 ,， 即 用 Trvlr + 1 左 沫 、( 可 以 把 这 个 元 素 
aetbnr 看 作 这 个 变换 的 “ 主 元 素 ”.) 
( 对 于 让 从 ?十 2 到 执行 : 
计算 tims 一 airfaryr 因此 [mral 所 1 
第 i 行 减 去 mirs X 第 7 十 1 行 。 
(i 的 运算 是 堪 乘 以 N.,， 型 矩阵 构成 的 ,在 位 置 (i,7)G 一 
7 十 2 ……。，?) 上 产生 零 元 素 。 
《十 ) 交换 第 7 十 1 和 第 (r 十 1)7 列 , 即 用 Pieauery 有 此。 
(iv) 对 于 i 从 ?十 2 到 ”实行 : 
mivfl 汪 第 i 列 加 到 第 + 十 1 列 . 
(iv) 的 运算 是 用 N 避 , 右 生 构成 ， 如 果 主 元 素 是 零 , #4: 是 
任意 数 ,最 简单 的 办 法 是 取 Nesliyony 一 了 
注意 ， 第 7 次 变换 取决 于 第 ? 列 的 第 ? 十 1 到 * 位 置 上 的 元 
素 , 它 对 第 一 列 到 第 + 一 1 列 没 有 影响 。 交换 是 为 了 避免 数值 不 
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稳定 。 第 7 列 的 第 1 个 到 第 ”个 元 素 也 不 改变 (= 一 + 一 1 个 
mil 值 可 以 存储 在 被 消去 的 元 素 er 的 位 置 上 。 

9. 68 给 出 的 描述 似乎 是 引信 算法 的 最 自然 的 途径 。 现在 我 
们 描述 第 " 步 的 两 个 不 同 的 新 形式 ,这 些 形式 易于 利用 内 积累 加 . 
我 们 恢复 上 标 + 以 便于 新 的 形式 的 澡 差 分 析 使 用 。 交 换 议 及 莱 子 
ni 像 前 面 -一样 确定 ,然后 按 下 列 公 式 确 定 修正 元 素 。 
新 公式 1 


a ey + Dam Gi=1,.…,7++1), 


a 立 pr ~ Riri rts (9.1) 
i 


G=r 2 7), 
a = a ma Gi = +2, 0), 
新 公式 瑞 
a 一 pa Ty, (bf r+ 2, 


Gr 
a = of reid + 5 Pani 


Fr 


人 = 二 2。 (92) 


a = a 十 Dr G=1l, r+). 


完成 有 关 的 内 积 运算 只 产生 一 次 含 人 误 益 。 上述 两 个 新 公式 在 数 
学 上 全 等 ， 但 是 实际 计算 中 却 不 相间 ,由 了 下 一步 的 二 元 素 是 从 元 
训 a CG 一 + 十 2,…，n) 中 选取 的 ， 我 们 可 以 在 计算 这 些 元 
素 的 同时 决定 《〈r 士 2}. 

不 管 我 们 用 原来 的 公式 还 是 新 的 公式 ， 在 第 + 步 的 左 苹 运算 
需要 (” 一 中 次 乘法 ， 右 乘 运算 有 n(n 一 7) 次 乘法 量 。 整个 约 
化 过 程 的 溢 法 总 次 数 是 


Fn — r+ Sn(n—r) ~ 三 (9.3) 


这 正好 等 于 Householder 方法 的 乘法 量 的 一 半 , 是 Givens 方法 的 
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乘法 量 的 四 分 之 一 。 


置换 的 窟 义 


10. 我 们 可 以 把 整个 变换 表示 为 
Neslaier se Nlsy Nalaw ol NT Ds Ny 
Tosen-y Na — H, (10.1) 
其 中 马 是 最 后 的 Hessenberg 型 。 现 在 我 们 说 明 , 交 换 实际 上 决定 
了 一 个 4 的 相似 置换 变换 ， 使 得 作 置换 后 主 元 素 自 然 地 出 现在 
指定 的 位 置 上 。 我 们 以 五 阶 矩 阵 为 例 ， 由 此 可 以 推广 到 一 般 情况 
《第 四 章 $22)、 当 4 一 5 时 ,(10.1) 式 可 以 写成 
Nslow Ns Taw Tw ) Ts Na ss TT 0 3 ) T2240 
X TasaTaw Te ds NI ys Tw NT TN = H, 
{10.2) 
因为 每 个 括号 内 的 习 积 都 是 单位 失 阵 ， 重 新 组 合 各 个 因子 得 到 
NOU NT ) Cw lysis) Ch Taal ol rly Tr) 
X Covlysy Ni dr ) (TN) NT = H. (10.3) 
等 式 左 边 中 间 的 矩阵 是 4 的 一 个 相似 置换 矩阵 ,我 们 可 以 记 它 为 
多， 如果 用 条,, 入 ,, 认 ,表示 每 对 括号 内 的 左 生 因 于。 那么 《10.3) 
变 成 


人 Ni = H. (10.4) 

因为 * 字 r(r 一 2,-…, 7 一 1), 每 个 鸭 , 是 与 N, 的 形式 完全 相 

同 的 矩阵 ; 只 是 重新 排序 后 它 的 第 > 列 有 非 零 的 上 次 对 角 线 元 素 

(第 一 章 441 (iv))， 因 此 ， 久 是 4 的 行列 经 过 相似 置换 后 的 形 

式 ， 它 在 约 化 过 程 中 不 用 选 主 元 素 就 可 化 成 妃 ， 且 胀 子 自动 满足 

模 不 大 于 1 的 条 件 . 

我 们 从 第 一 章 $41 (证 ) 知道 ,矩阵 Nz'N3:N7! 中 没有 si 的 

先 积 出 现 。 我 们 可 以 用 入 表示 这 第 阵 汪 积 .。 现在 因为 这 索 积 中 

没有 Nai, 所 以 从 是 单位 三 角形 算 阵 ， 其 第 一 列 是 c:。 六 的 第 
列 对 角 线 以下 的 元 素 是 经 过 置换 的 nr。 因 此 ,我 们 有 

AN = NH, (10.5) 
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假如 变换 4 时, 不必 交 换 的 话 ,上 式 就 会 变 成 
AoN = NH, (10.6) 
在 第 四 章 $5 兽 提出 我 们 执行 主 元 素 Gauss 消去 法 之 前 应 该 
平衡 第 阵 。 同 祥 , 在 这 里 踪 非 矩阵 已 经 平衡 ,否则 我 们 说 明 主 元 素 
的 正确 性 是 困难 的 ， 在 特征 值 问 题 中 ,平衡 矩阵 是 可 以 做 到 的 , 例 
如 用 D4,D™* 代替 4, 其 中 是 迁 当 选取 的 对 角 和 矩阵 , 它 使 得 变 
换 后 的 矩阵 的 每 一 行 ,每 一 列 的 最 大 模 元 素 的 数量 级 差别 不 太 大 。 
这 个 问题 现在 还 没有 完全 令 人 满意 的 分 析 。 在 ACE 上 我 们 作 过 
不 同形 式 的 平衡 试验 。 毫 无 疑问 , 避免 用 平衡 很 差 的 矩阵 作 计 算 
是 非常 重要 的 〈 对 这 个 问题 的 讨论 可 参见 Baver (1963) 和 
Osborne (1960)). 


直接 的 化 拭 阵 为 Hessenberg 型 


也 , 在 第 四 竟 $17 我 们 考察 过 用 不 选 主 元 素 的 Gaus 消去 法 
产生 三 角形 矩阵 N 和 4。-, 使 得 


NA 一 do. (11.D) 


然后 在 836 我 们 说 明了 N 和 4,-, 可 以 由 等 式 (11.1) 两 边 的 元 素 
相等 直接 确定 ， 随 后 又 说 明 这 种 算法 可 以 和 选 主 元 素 办 法 结合 在 
一 起 ， 现 在 按 同 样 的 方式 ,暂且 不 管 选 主 元 素 , 我 们 说 明 用 (10.6) 
可 以 不 经 过 变换 到 4, 的 中 间 步 又 而 直接 确定 N 和 右 。 我 们 略 去 
如 中 的 下 标 零 ,因为 现在 这 是 没有 用 的 。 当 二 一 5 时 ,方程 (10.6) 
的 形式 是 


4 N 
XXXX X 1 
X XXX X D 工 
X XXX X 0 X 1 
X XXX x 0 X XI 
XXX XXX 0 X X 1 
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N H 
1 xxxxx 
_| *X xXx xX | a) 
|0x1 xxxx 
|°*x: xxx 
人 XXX 1 X X 


利用 矩阵 的 结构 和 等 式 两 边 对 应 的 列 相等 ， 我 们 可 以 逐 列 定 出 六 
和 已 的 元 素 。 事 实 上 ， 对 第 " 列 建 立 等 式 我 们 可 以 确定 总 的 第 > 
列 和 的 第 (+ 士 D) 列 。 当 然 ,我 们 已 预先 知道 NN 的 第 一 列 是 6。 

我 们 用 归纳 法 说 明 , 假 定 由 (10.6) 式 中 前 (7 一 1) 列 相 等 , 我 
们 已 确定 了 五 的 前 (> 一 1) 列 和 NN 的 前 7 列 。 现 在 我 们 利用 第 7 
列 相等 ,左边 的 (i, +) 元素 是 
ezr ret 十 Aetnar 十 十 Ginnar《 对 所 有 2)，(11.3) 
而 右边 的 (i,r》 元 素 是 

人 士 Bar 十 nh tt hi 在 生 rz 十 1 

ij 十 0 1 
式 中 尽管 wa 是 零 , 但 为 了 N 的 第 一 列 的 作用 不 予 特殊 看 待 , 我们 
也 把 它 包括 进去 了 。 现 在 汝 为 N 的 第 + 列 已 知 ， 对 所 有 i 都 可 以 
计算 《11.3)。 由 对 应 的 元 素 相 等 ， 我 们 逐次 得 到 名,，42，*………， 
rt。 这 是 吾 的 第 > 列 和 N 的 第 
(+ 十 1) 烈 的 非 零 元 素 。 当 我 们 找到 妃 的 第 ” 列 时 ， 这 个 过 程 就 
终止 因为 X 的 第 一 列 已 知 , 所 以 没有 开始 的 困难 . 

这 个 约 化 方法 可 以 充分 利用 内 积累 加 的 优点 ， 从 (11.3) 和 
(11.4) 我 们 得 到 公式 

一 arX1 二 BD sinw 一 p32 i, 
k=l 


kartt 


mi (0 x 1 Bain — DD abi) /hres 
Xml 


k=r+l 


” (11.4) 


G ort 2 1). 
(11.5) 
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结果 jz 由 一 个 内 积 给 出 , 另 一 个 内 积 除 以 hws 给 出 mwsa。 值得 
注意 的 是 ,只 要 知道 NN 的 第 一 列 就 可 以 用 这 个 办 法 确定 整个 N 和 
五 。 第 一 列 是 < 没有 特别 的 作用 , 我 们 取 尾 何 第 一 个 元 衰 为 1 的 
向 量 作为 第 工 列 同样 可 以 定 出 Y 和 和 五 并 且 方 程 者 不 改变 。( 我 们 
刚才 证 明 的 结果 与 $7 的 十 分 类 似 .) 这 也 是 我 们 的 公式 中 包 售 mr 
Gz 1) 的 项 的 部 分 原因 。 如 果 我 们 用 58 的 方法 作 计算 ,那么 取 
NN 的 第 一 列 为 别 的 向 量 ,而 不 是 “等 价 王 在 开始 执 生 一般 的 过 程 
之 前 计算 Ni4oNi*， 这 个 结果 在 今后 是 重要 的 。 


结合 交换 

12. $11 的 方法 在 形式 上 是 和 $8 的 恒 等 的 ， 但 是 没有 使 用 交 
换 技术 ， 结合 交换 技术 是 十 分 简单 的 , 也 许 用 算法 语言 来 描述 它 
最 为 方便 。 全 过 程 共有 ” 步 ， 第 * 步 次 定 五 的 第 7 列 和 N 的 第 
(Cr 十 1) 列 . 以 zs 一 6,7 一 3 为 例 , 第 7 步 开始 之 前 矩阵 的 结构 
是 


Bu ha qn Gu Hy ts | 
Bu hy An Gm 41 G3 | 0 
Ta a | . (12.1) 
2 Ra I G4 Hs A% | Os 
52 5 09 Gs G35 A% | Ts 
Hy fey 08 06 065 06- Os 
2 3 
虽然 可 能 作 过 交换 ,我 们 还 是 用 a; 表示 原 矩 阵 4 的 元 素 。 下 面 我 
们 来 描述 第 * 步 并 说 明 其 中 的 交换 情况 和 寄存 单元 只 和 ” 的 意 
义 ， 
GD 对 于 i 从 1 到 +: 
计算 jzr 一 ar 十 2， atkr 一 号 zitiir。， 如 果 有 可 能 就 作 


内 积累 加 ， 把 最 后 的 结果 会 人 为 半 精 度 并 小 冰 在 a5 上. 《如 果 和 
式 的 上 限 小 于 下 限 , 即 1 一 1<2 或 # <” 十 1， 就 略 去 这 个 和 
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式 ; 注意 。 我 们 已 知 ms 一 0 (i 一 2,…',#)) 如 果 > 一 ;整个 
约 化 过 程 就 完成 了 。 
(Ci 对 于 i 从 +r 十 1 到 ss 


计算 (or 二 , one 一 局), 存储 在 寄存 单元 
中 。 如 果 有 可 能 每 一 个 和 式 都 应 访 用 双 精度 累加 ,这 时 需要 两 个 
寄存 单元 ， 肖 个 计算 oi 并 且 记 录 max|ar|， 如 果 


max [ol = |owtorl, 
r+ 


就 存储 (+ 十 1)。 如 果 有 车 于 个 o; 都 达 极 大 值 , 我 们 取 第 一 个 。 

《年 ) 交换 第 ” 十 1 行 和 第 (r + 1 行 ( 包 括 wr 和 o), 交换 
第 + 十 1 列 和 第 (r 十 1 列 。 把 当前 的 ot: 伟人 为 单 精度 后 给 
和 rrar 赋值 并 履 盖 在 rttr 上 ,这 是 主 元 素 。 

(iv) 对 于 从 ”十 2 到 3 

计算 ra 一 ifjrrars 覆盖 于 or 上. 

有 几 点 值得 特别 提出 的 是 : 如 果 在 某 阶段 


max |oil 一 0， 
it 


那么 mh 一 上 士 2,……，#) 就 不 能 确定 ， 我 们 任 取 一 个 寞 小 
于 1 的 信 ， 仍 然 可 以 保持 数值 稳定 。 最 简单 的 办 法 是 取 有 关 的 
miwtt 为 零 。 如 果 我 们 用 有 累加 的 浮 点 运算 ,那么 累加 的 结果 0: 会 
人 为 单 精度 ,所 受 的 损失 是 小 的 。 在 决定 mw: 之 前 ,每 一 个 必 都 
可 以 临时 究 盖 在 *v 上 ,以 后 才 分 配 一 些 单元 存储 a;:， 如 果 使 用 定 
点 累加 ,我 们 想 要 得 到 全 部 效益 ,就 必须 用 双 精 度 的 wm， 但是, 在 
第 " 步 中 只 有 = 一 ?+ 个 ,对 于 量 2,3',…,r' 来 说 , 0; 的 寄存 单 
元 中 总 有 足够 的 空间 来 存放 它们 。 我 们 应 该 善 重 指出 , 除了 会 人 
误差 之 外 ,我 们 这 里 讨论 的 方法 与 $58,9 的 相同 。 用 准确 的 运算 ， 
交换 行列 的 情况 , 如 , 和 zi 都 是 一 致 的 ， 


数值 例子 
13. 在 表 2 中 我 们 给 出 一 个 5 阶 矩 阵 的 数值 例子 ， 我 们 采用 
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表 2 


4 
0.3200 0.2700 0.2300 0.3200 0.4000 his = 0.32000000 
一 >| 0.2500 0.0300 0.7100 0.2100 0.1700 oa = 0.25000000 
| 0.4300 0.7300 0.1300 0.3700 0.8500 gs = 0.43000000 
[一 = 0.5300 0.2500 0.5H00 0.6200 0.1600 ge me 0.53000000 
0.1600 0.6500 0.4600 0.5600 0.3200 gs = 0. 16000000 
1 1 maxiail = [od;2 一 4 
第 二 步 开 始 时 的 形状 

0.3200 0.2300 0.2700 0,4000 

0.6200 0.5100 0.2500 0.1600 

一 | 0.8113) 0.3700 0.1300 0.7300 0.8500 

| 《0.4717》 0.2100 0.7100 0.0300 0.1700 

|_ lL C0.3019) 9,5600 0.4600 0.6500 0.3200 


t 1 


hs me 0.3200 + 0.2300 X 9.8113 十 0.2700 X 0.4717 + 0.4000 x 0.3019 
一 0.75471800 
站 am 0.6200 十 0,5100 X 0.8113 十 0,2500 x 0.4717 十 0.1600 x 0.3019 
一 1.1999 9200 
gy 一 0.3700 十 0.1300 x 0.8113 + 0.7300 X 0.4717 十 0.8500 x 0.3019 
一 0.8113 X 1,2000 一 0.10286500 
Ge 0.2100 + 0.7100 x 0.8113 + 0.0300 X 0,4717 + 0.1700 X 0.3019 
一 0.4717 X 1.2000 一 0.28545700 
Ou = 0.5600 + 0.4600 X 0.8113 十 0.6500 X 0.4717 + 0.3200 X 0.3019 
— 0.3019 X 1.2000 = 0.97413100 
maxlodl ~ io; 3 5 


注意 在 计算 0 时 立即 要 售后 的 值 名， 


第 三 步 开始 时 的 形状 
0.3200 。 0.7547 0.4000 0.2700 0.2300 
0.5300 1.2000 。 0.1600 0.2500 0.5100 
《0.3019) 。 0.9741 0.3200 0.6500 0.4600 
一 >| (0.4717) (0.2930) 0.1700 0.0300 0.7100 
| Lco.8113) C0.1056) 0.8500 0.7300 0.1300 


忽 表 2 


hs = 0.4000 + 0.2700 X 0.2930 + 0.2300 X 0.1056 -= 0.50339800 
hay == 0.1600 + 0.2500 X 0.2930 + 0.5100 X 0.1056 = 0.28710600 
hs = 0.3200 + 0.6500 x 0.2930 + 0.4600 x 0.1056 
一 0.3019 X 0.2871 = 0.47235051 
Te 0.1700 + 0.0300 X 0.2930 + 0.7100 x 0.1056 
— 0.4717 X 0.2871 一 0.2930X 0.4724 = 一 0.02007227 
J 0.6500 + 0.7300 X 0.2930 十 0.1300 x 0.1056 
~— 0.8113 X 0.2871 — 0.1056 x 0.4724 = 0.79480833 
mazx|o|=]0,| ;#5, 
不 仅 在 计算 04 时 ,而 且 在 计算 如。 时 都 立刻 要 用 舍 人 后 的 值 as 


第 四 步 开始 时 的 形状 
9.3200 0.7547 0.5034 。 0.2300 0.2700 
0.5300 1.2000 0-2871 0.5109 0.2500 
《0.3019) 0.974 0.4724 0.4600 0,6500 


《0.8113)》 (0.1056) 948 0.1300 0.7300 
《9.4717》 (0.2930) (~0.0253) 0.7100 0.0300 

hs = 0.2300 + (~0.0253) X 0.2700 一 0.22316900 
hss 一 0.5100 + (~0.0253) x 0.2500 .50367500 
ht = 0.4600 二 《一 0.0253) X 0.6500 ~ 0.3019 x 0.5037 == 0.29148797 
hss 一 0.1300 十 《一 0.0253) X 0.7300 一 0.8113 x 0.5037 

一 0.1056 x 0.2915 一 一 0.32790321 
On 一 0.7100 十 《一 0.0253) xX 0.0300 — 0.4717 X 0.5037 

一 0.2930 X 0.2915 — (~0.0253) X C0.3279) 一 0.37794034 

现在 因为 只 有 一 个 or 5 当然 是 hm 


第 五 步 开始 时 的 形状 
0.3200 0.7547 D5034 0.2232 0.2700 
0.5300 1.2000 0.2871 0.5037 0.2500 
《0.3019) 0.9741 0.4724 0.2915 0.6500 


C0.8113) (0.1056) 0.7948 一 0.3279 0.7300 
C0.4717) 《0.2930》 《一 0.0253》 0.3779 0.0300: 


hs 一 0.2700 0.27000000 
500 =0.25000000 
0.6500 — 0.3019 X 0.2500 = 0.57452500 


0.7300 一 0.8113 X 0.2500 — 0.1056 X 0.5745 = 0.46650780 
hs = 0.0300 一 0.4717 X 0.2500 一 0.2930 XK 0.5745 
— (~—0.0253) x 0.4665 0.24445105 


oe 
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续 表 2 


最 后 的 形状 
0.3200 0.7547 0.5034 0,2232 -0.2700 
0.5300 1.2000 0.2871 0.5037 | 括号 内 的 是 类 
《6.3019) 0.9741 0.4724 0.2915 0.5745 | 阵 信 的 非 备 元 迷 
《0.8113》 (0.1056) 48 一 0.3279 oes | 
《0.4717) (0.2930) 《一 | 53] 0.3779 一 0-2445 


用 变换 确定 的 4 的 填 换 了 给 定 为 

让 一 Toorsyae47ae7sTu 
0.3200 0.3200 
0.5300 0.5200 
0.1600 0.5600 
0.4300 0.3700 
0.2500 0.2100 


0.3200 
0.5300 
AN 一 | 0.1600 
0.4300 
0.2500 


0.3200 
0.5300 

NH =| 0.160007 
0.429989 
0.250001 


0.754718 
1.199992 
1.336411 
1.076425 
0.851497 


0.7547 
1.2000 
1.336380 
1.07642496 


0.4000 
0.1600 
0.3200 
0.8500 
0.1700 


0.2300 


“0.5100 


0.4600 
0.1300 
0.7100 


0.503398 0.22: 


0.287106 
0,559026 
1.077618 


0.2700 
0.2500 
0.6500 


O73 


00 


0.0300 


3169 


0.503675 


0.443555 


[4 


0.253766 0.70 


0.5034 
0.2871 
0.55907549 0.44356703 0.64997500 
1.07760967 0.11153421 0.72999220 
0.85145130 0.25372983 0.70920066 0.02995105 


1531 
9241 


0.2232 
0.5037 


0.2700 
0.2500 
0.6500 
09.7300 
0.0300 


0.2700 
0.2500 


$12 的 方法 和 有 内 积累 加 的 四 位 十 进位 定点 运算 。 这 个 算法 比 我 


们 已 描述 过 的 复杂 ， 


些 我 们 详细 地 把 这 个 例子 写 出 来 .这 个 方 


法 在 自动 计算 机 中 显得 十 分 紧 痉 ， 到 为 我 们 给 出 的 各 个 部 分 都 是 
存储 在 同样 的 mw? 个 单元 中 。 注意 , 由 于 入 的 第 一 列 是 co， 似乎 第 


一 步 与 其 它 各 步 不 同 


. 《如 果 我 们 修改 方法 ,人 允许 N 的 第 一 列 为 第 
一 个 元 素 是 1, 其 他 元 素 不 大 于 1 的 任 一 个 向 最 ,那么 第 一 步 就 不 
特殊 了 .) 在 编制 这 个 算法 的 程序 时 , 对 第 一 步 和 最 后 一 步 的 处 理 
要 特别 小 心 ， 箭头 指明 了 行 、 列 的 交换 。 加 横 线 的 元 索 是 最 后 的 
已 的 元 素 , 而 括号 内 的 是 六 的 元 素 。 
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在 这 个 例子 的 末尾 ， 我 们 列 出 六 ， 用 它 得 到 N 和 互 不 必 作 交 
换 。 最 后 ,我 们 给 出 计算 的 N 和 计算 的 互 的 准确 的 乘积 以 及 计 和 
计算 的 N 的 生 积 。 如 果 不 考虑 合 人 误差 , 它们 应 该 是 相等 的 。 我 
们 比较 两 个 堵 积 可 以 看 出 ， 它 们 没有 一 个 元 案 的 差别 大 于 单个 合 


人 误差 的 最 大 值 二 10 


误 束 分 析 


14. 现在 我 们 说 明 在 一 定 条 件 下 , 我 们 对 于 (3N 一 NF) 的 


元 素 的 估计 是 正确 的 。 


假定 主 元 素 是 按 上 面 描述 的 方法 选取 的 ， 计 算 中 用 有 内 积累 
加 的 定点 运算 ， 又 假定 4 的 所 有 元 素 和 计算 的 互 的 所 有 元 素 的 模 
都 小 于 1 那么 从 (113) 和 (11.4), 当 庆 <r 十 1 时 ,我 们 有 


hi flair 十 airrtitryur 十 … 十 insane 


一 91 一 


十 qinmmr 


ih 十 err 


qi 十 drifirte 


— gahy — 
其 中 
1 fr 
lenl < (22), 


类 似 地 , 当 i >>r 十 1 时 ,我 们 有 
mor 一 folair 十 airtinrtr 十 十 ginfes 
— mhar — Hibre) /horse] 


二 《air 十 GprHprtbr 十 十 Gingar 


一 mit 一 … 一 Wirpor)1jrtr 十 Wi 


其 中 
ll < 2°), 
用 rr 莱 (14.3), 我 们 有 
ET TR Ps 十 “二 Gingar 
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(14.1) 


(14.2) 


(14.3) 


(14.4) 


一 Why — 一 + Bis {14.5) 
其 中 
Bi = re (14.6) 
重新 安排 (14.1) 和 (14.5) 显 杀 出 
(NB 一 加) 一 sr (isr=1,2,..,n), (14.7) 
而 从 (14.2) 和 (14.6) 得 出 


lol S00 Cr 一 2， (148) 


因为 我 们 假定 了 1H1 的 所 有 元 素 都 不 超过 1， 因 此 我 们 最 后 得 
到 

Arv 一 NE 一 F， (14.9) 
其 中 


A 二 (2-9。 (14.10) 


这 是 最 令 人 满意 的 结果 ,因为 我 们 大 松 不 能 希望 《2N 一 NH) 会 
有 更 小 的 信 .。 但 是 这 个 结果 也 许 并 不 像 看 起 来 那样 好 。 等 式 
(14.9) 意 味 着 

HNN:(A4 — FN DN (14.11) 
以 及 

NAN=H+ N71F, (14.12) 
因此 , 计算 的 五 是 〈 科 一 EN 的 一 个 准确 的 相似 变换 , 计算 的 
N 是 变换 矩阵 。 我 们 也 可 以 说 玉 与 的 一 个 准确 的 相似 变换 的 
差 是 NIF。 这 里 涉及 的 只 是 而 不 是 4， 但 这 是 无 关 要 紧 的 ， 
因为 的 特征 值 和 它们 各 由 的 条 件数 与 4 的 都 相同 。 

现在 ,我 们 有 


lelh < trl (14.13) 


然而 ,尽管 元 素 m5 不 大 于 1, 但 是 IN" 可 以 很 大 。 事实 上 ， 如 
果 所 有 有 关 的 非 零 元 素 ri 都 等 于 一 1， 那 么 以 > 5 为 例 我 们 
有 
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1 
一 1 1 

2 1 
4 2 1 1 

而 一 般 情 况 下 , os 等 于 2* 了 当然 ,不 作 更 深入 的 分 析 , 我 们 不 能 
得 到 IINT'Fb 的 没有 因子 2” 的 界 . 我 们 可 以 对 比 Y 是 本 矩阵 的 
情况 ,并 且 立 刻 得 到 


(14.14) 


ocooor 


Np Fl. 

15. 这 个 方法 有 责 个 危险 的 因素 .第 一 ， 妃 的 元 素 可 能 比 4 
的 大 得 多 , 使 我 们 估计 的 界 时 所 作 的 假定 不 成 立 。 如 果 妃 的 最 
大 元 素 是 24 量 级 ,那么 P 的 界 就 包含 因子 24。 第 二 ,即使 我 们 选 
取 主 元 素 ，N-: 的 范 数 也 可 能 很 大 。 现在 虽然 我 们 添加 了 来 自 
N~! 的 范 数 的 危险 ,这 神情 况 与 部 分 主 元 素 Gaus 消去 法 (或 三 角 
形 分 解 ) 的 没有 什么 不 同 ,使 主 元 素 增长 的 因素 似乎 还 没有 人 作 过 
分 析 . 

在 实际 计算 中 ,好 像 很 少 发 生 主 元 素 增 长 的 悄 况 ,并 且 和 矩阵 
N 的 范 数 是 工 数量 级 的 。 因 此 ,通常 NF 小 于 二 2-“， 我 
们 发 现 这 正 是 〖iF 本 身 的 界 。 这 种 情况 与 我 们 讨论 Gauss 消去 
法 时 曾经 描述 过 的 情况 非常 相像 . 

基本 的 结果 是 : 使 用 稳定 初等 矩阵 的 变 的 通常 比 Householder 
方法 还 要 精确 ， 可 是 它 存在 主 元 素 增长 和 N-: 的 范 数 大 这 两 个 潜 
在 的 危险 。 谎 异 的 人 也 许 宁可 用 Houscholder 方法 。 总 的 来 看 ， 
从 道 愤 的 观点 ,这 个 方法 比 三 角形 化 的 说 服 力 稍微 强 一 些 。 如 果 
你 的 计算 机 作 内 积累 加 很 不 方便 。 那 么 稳定 的 初等 矩阵 总 是 不 能 
令 人 满意 的 - 


有 关 的 误 禁 分 析 
16. 我 们 已 经 给 出 用 定点 累加 运算 的 误差 分 析 。 如 果 用 浮 点 


= 380 二 


累加 运算 ,忽略 2* 阶 项 ,我 们 找到 的 界 , 以 # 一 5 为 例 ， 


0 lhl Maal hl és 
14a1 Vhsl lasl Taal 85 
lFl <27 | lBal lbsl 1 和 | Thyl [hs 
[sal Hhsal Hasl lal lhes 
land Th] 151 NBsl Lhs 


(16.1) 


通常 , 当 变 换 矩 阵 有 一 些小 元 素 时 。 和 定点 计算 的 情况 相 比 , 除了 


不 必 引 比例 因子 即 可 自动 处 理 主 元 素 的 增长 之 外 ， 
处 稍 多 些 . $8 ~59 的 方法 的 分 析 与 直接 约 化 矩阵 为 
方法 的 分 析 有 很 多 共同 点 。 对 $9 的 方法 ,例如 对 有 


的 改进 公式 1, 我们 有 


我 们 得 到 的 好 
Hessenberg 型 
定点 内 积累 加 


{Tety Arlt NA 一 Nd 二 Fo (16.2) 
其 中 从 等 式 〈9.1) 和 决定 sot: 的 等 式 ， 我 们 得 到 下 述 结果 ， 当 


4 一 6,r 一 2 时 


1F 和 2 人 


mm 
mp ee 


1 


P22moomo 


mp ee 


1 


| 


(16.3) 


这 里 我 们 仍然 假定 4,-， 和 4, 的 所 有 元 素 都 不 大 于 工 的 。 


等 式 (16.2) 可 以 表示 为 


Nllrrpety dea NA = A + NmF— AtG,, (16.4) 


并 且 有 


1G.1 委 27 全 


Rb Rn hm = 
"Poopo 


mooo 


(16.5) 
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类 似 地 ,对 于 改进 的 公式 了 , 我 们 可 证 明 
Noelonrsiy A T KN = 4, (16.6) 

并 且 对 于 K, 我 们 可 以 得 到 与 对 G, 同 祥 的 界 。 等 式 《16.6) 给 出 
4-: 的 一 个 摄 动 , 它 等 价 于 在 第 > 步 产 生 的 误差 ， 

可 惜 , 无 论 用 哪 一 个 改进 公式 , 对 4。 上 的 与 爹 过 程 产生 的 会 
人 误差 等 价 的 摄 动 的 界 包含 因子 2*。 可 以 想像 它 比 直接 约 化 方 
法 的 界 要 差 一 些 。 

17. 随 着 4 变换 到 4,-,。 我 们 观察 如 的 某 个 特征 信 1 的 变 
化 情况 是 有 启发 性 的 。 通常, 这 个 特征 值 的 条 件数 〔 第 二 章 $31) 
是 变化 的 。 如 果 用 111s 中 | 表示 相应 的 信 ， 那 么 对 于 改进 公式 I 
和 1, 特征 值 2 最 后 的 误差 的 粗略 的 界 分 别 是 


Feel HFK 7D 
如 果 我 们 记 


«= max|s™ fs)|, (17.2) 
那么 最 后 4 的 误差 不 大 于 4。 摄 动 所 引起 的 误差 ， 报 动 引起 的 误 
差 的 界 分 别 是 


SH (73) 
国 此 ,从 (16.5) 用 Eudid 范 数 估计 当然 有 
a [r(r 十 4) 十 中] 让 (17.4) 


这 个 和 式 渐 近 收 仇 于 : 志 ， 

如 果 每 一 个 特征 值 的 条 件数 变化 不 是 太 大 ， 那 么 = 的 数量 级 
是 1, 同时 我 们 得 到 很 满意 的 结果 。 现 在 ,如 果 ， 和 是 对 应 1 的 
规范 化 左 、 有 特征 向 量 ,那么 4 的 特征 向 量 是 Niy 和 Nz'x， 但 是 
它们 不 再 是 规范 化 的 。 因 此 ,我 们 有 


可 


Tr) NT ix 1 
Cals | lwE yb, (C17.5) 


5 
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于 是 ，% 和 。 的 比率 与 向 量 Nz'y 和 Nztz 的 长 度 有 关 ， 这 两 个 向 
量 的 分 量 分 别 是 

(ps 为 十 mp 十 ao 二 于 nya 
和 

(19 Ki3 x3 — Waxy Xe 一 N13 a — fr) 
因此 变换 后 的 特征 向 量 的 长 度 可 能 逐渐 增 大 ， 即 使 由 于 选 主 元 素 
使 1ao1 < 1, 也 是 如 此 .。 

我 们 曾经 用 贿 机 选取 的 矩阵 检验 了 这 个 变化 ， 我 们 发 现 条 件 

数 变化 很 小 。 可 是 因为 涉及 的 工作 量 很 大 , 我 们 只 能 用 一 个 小 模 
型 


(17.6) 


我 们 着 重 指出 ， 如 果 不 选 主 元 素 ， 并 且 ms 的 量 级 是 24， 
那么 一 般 在 4, 中 有 一 些 元 素 比 4，-: 的 元 素 大 24 倍 . 因此 , 不 选 
主 元 素 的 后 果 可 能 比 Gauss 消去 法 的 情况 更 加 严重 。 我 们 对 各 
个 特征 值 的 条 件数 变化 的 研究 结果 表明 : 当 一 个 m+ 是 大 的 时 
候 , 第 * 次 变换 会 使 条 件数 严重 恶化 。 


Hessenberg 矩阵 的 劣 定 


18. 在 $12 描述 的 约 化 方法 中 ， 如 果 在 某 一 步 因 为 发 生 相 约 
致使 所 有 的 元 案 oi 都 小 ,那么 主 元 素 , 其 绝对 值 是 maxlo|， 它 本 
身 也 小 。 这 个 主 元 素 在 用 于 除 别 的 o 导出 和 溢 子 try 之 前 必定 
经 过 了 伟人 ,因此 所 有 这 样 的 乘 子 都 是 劣 定 的 。 我 们 发 现 ,在 这 种 
情况 下 最 后 的 计算 Hessenberg 矩阵 与 使 用 的 计算 精度 紧密 相关 。 
重要 的 是 , 认识 态 的 这 个 劣 定 性 与 特征 值 的 劣 定 无 关 。 这 种 情况 
类 似 于 第 五 章 $28 拱 述 的 关于 对 称 Givens 约 化 最 后 的 三 对 角 和 矩 
阵 的 劣 定性 。 我 们 研究 在 准确 计算 时 如 果 发 生 所 有 的 0; 都 是 零 
的 情况 是 有 益 的 ,这 时 "it 不 能 确定 ,我 们 可 以 到 任何 值 。 与 这 
种 情况 相对 应 ， 在 实际 计算 中 当 o; 小 时 , 完全 不 确定 性 表现 为 劣 
定 。 这 些 讨论 对 以 后 的 研究 是 重要 的 。 


用 M/ 型 稳定 矩阵 化 为 Hessenberg 型 
19. 在 第 四 章 $48 我 们 叙述 了 用 M% 型 矩阵 左 乘 把 矩阵 化 为 
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三 角 型 。 对 千惠 相似 变换 把 和 矩阵 化 为 Hesseaberg 型 有 一 个 对 应 
的 方法 。 像 在 三 角形 化 中 的 做 法 一 样 ， 这 个 方法 与 平面 旋转 方法 
十 分 类 似 。 第 7 列 中 {sn 一 + 一 D 个 零 元 素 是 用 (一 一切 个 
稳定 的 矩阵 M1, 而 不 是 一 个 稳定 扰 阵 Nm 逐个 引进 的 . 

在 三 角形 化 的 情形 ， 内 为 这 个 方法 能 找到 原 矩 阵 的 全 部 前 主 
子 式 ,因此 这 种 办 法 得 到 大 力 推 荐 。 对 于 相似 约 化 ,似乎 没有 这 种 
好 处 , 它 需要 的 续 法 量 和 $11 的 直接 约 化 一 样 多 ,我 们 不 再 详细 研 
究 它 。 


Krylov 方法 


20. 现在 我 们 描述 一 个 算法 《通常 用 来 计算 显 式 特征 多 项 
式 ), 它 自然 地 导出 与 上 述 方法 紧密 相关 的 第 二 类 方法 。 这 个 方法 
是 Krylov (1931) 提出 的 
如 果 如 是 # 级 向 量 ,那么 下 式 定义 的 向 量 纪 为 
br A'bos (20.1) 
满足 等 式 
Bot Padbet + «oe + Pobo — 0, (20.2) 
这 里 i 十 pol! 十 ，… 十 Po 是 4 的 特征 多 项 式 (第 一 章 
$34 ~$39)。 等 式 (20.2) 可 写 为 
Bp —b, Bo (bibie.ibe 1). (20.3) 
这 是 一 个 非 奇异 的 线性 方程 组 ,用 它 可 确定 p, 因而 可 计算 4 的 特 
征 方程 。 如 果 和 的 级 小 于 >。 那么 关于 4 的 最 小 多 项 式 的 次 数 
小 于 "。 于 是 我 们 有 
Bat cmbmat -et ebm 0 (mH), (20.4) 
并 且 从 方程 (20.4) 我 们 可 以 确定 最 小 多 项 式 加 十 ee- 十 
十 co 这 是 特征 多 项 式 的 一 个 因子 。 如 果 4 是 减 次 的 ， 那 么 每 一 
个 向 量 的 级 都 小 于 a. 
实际 上 , 我 们 预先 不 知道 的 级 是 否 小 于 >。 我 们 很 需要 其 
种 技术 提供 这 个 信息 。 我 们 要 描述 的 方法 是 基于 下 述 Gauss 消去 
法 的 变形 。 
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逐 列 Gauss 消去 法 


34. 我 们 用 区 表示 要 执行 消去 的 矩阵 ， 过 是 它 的 列 。X 经 过 
? 步 化 为 上 三 角 型 局 ， 每 一 列 用 一 步 ，xr rt xn 列 不 受 前 
{r 一 1) 步 的 影响 ， 对 于 w 一 5, r 一 3 的 情况 , 矩阵 和 已 化 为 上 
三 角 型 时 ,其 结构 为 
Wl Wa Xl Xl Xl J 
Na Wn zn xm zy |o 
Wy Wa Fs x x | (G21.1) 
nu Na Xa Xu x | 


| 
Wy Rs Xm XH Xs ~ Os 


第 ” 步 叙述 如 下 ， 

G) 对 于 从 1 到 ”， 用工 乘 x*r， 并 存储 这 个 乘积 在 双 精度 
单元 中。 
对 于 i 从 1 到 ?一 1 执行 (六) 和 (党 ); 

(6) 交换 o; 和 oi, 把 新 的 cz 会 人 为 单 精度 赋值 于 wir 并 覆盖 
在 xir 上 . 

(者) 对 于 7 了 了 从 十 1 到 4 用 oj 一 pi or 代替 oj。 

(iy) 选 5 使 得 1or| 一 max loil, 如 果 有 几 个 最 大 值 ,约定 取 
第 一 个 ,存储 + 在 第 * 列 之 后 

(YY) 交换 w 和 和 ats 使 人 新 的 or 为 单 精度 赋值 于 wr 并 覆盖 在 
xr 上 。 

(vi 对 于 站 从 rf 十 1 到 wn, 计算 mr 一 orjer 并 获 盖 在 x 


上 . 

我 们 着 重 指出 ， 这 个 方法 与 有 内 积累 加 和 部 分 主 元 素 的 三 角 
形 分 解 (第 四 章 539) 是 恒 等 的 ,甚至 舍 人 误差 都 一 样 ， 可 是 ,如 果 
区 的 第 * 列 与 前 面 的 列 线性 相关 ， 在 这 个 修改 过 程 的 第 7 步 会 显 
示 出 来 , 此 时 在 第 (iv) 小 步 中 出 现 一 组 零 om 一 ro 这 


385 


时 , 后面 的 各 列 还 未 作 过 任何 计 算 。 

这 个 方法 可 以 应 用 于 由 商量 名 各 ……，s 构成 的 矩阵 
也。 如 果 在 处 理 bo 时 发 现 它 与 bo b，'……， 5bm-! 线性 相关 , 我们 
就 不 计算 后 面 的 向 量 。 我 们 可 以 写 


Wn M2 him fhmt1 
Wyse am Wimtl 
Un = ”mn | C212) 
Hmm Hom 
方程 
Uc 一 一 xm {21.3) 


的 解 给 出 了 名 关于 4 的 最 小 多 项 式 的 系数 co cis* "cm-i, 


实际 的 困难 


22. 不 难 证 明 ， 如 果 4 是非 减 次 的 ,那么 几乎 所 有 的 向 量 都 是 
# 级 的 并且 得 则 完全 的 特征 方程 。 

实际 上 ,由 于 省 人 误差 的 影响 ,线性 相关 与 线性 无 关 和 的 差别 变 
得 模糊 ,甚至 如 的 级 小 于 # 时 ,相应 的 那 组 m 通常 也 不 准确 为 零 . 
此 外 , 如 果 和 矩阵 3 是 病态 的 ， 这 个 性 质 可 能 会 从 一 组 小 的 cy 显示 
出 来 , 它 与 真 的 线性 相关 无 法 区 别 。 遗憾 的 是 , 确 有 一 系列 因素 使 
得 如 可 能 成 为 病态 的 ， 现 在 我 们 来 讨论 这 个 问题 。 

为 了 深入 地 认识 这 些 因素 ， 让 我 们 为 简单 起 见 假 定 4 是 
diag(41), 并 且 


1 > || > > 1 (22.1) 
假定 初始 向 量 名 的 分 量 为 PP， …，p8。， 我 们 知道 如果 有 一 
个 Bt 是 零 \ 向 量 名 的 级 就 小 于 ”。 因 而 下 是 奇异 的 .因此 ,我 们 
本 以 设想 小 元 素 PB; 会 给 出 一 个 病态 的 矩阵 8B, 但 是 选取 出 一 1 
(i 一 1, 2 ……，2) 应 该 是 有 利 的 。 这 时 , 撼 阵 了 给 定 为 
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1 
B=| 1 | {22.2) 
i 
而 给 出 特征 多 项 式 系 数 的 方程 是 
Bp 一 一 5。 Bo (1 23， 和 3)。 (22.3) 


从 8 的 形式 可 知 ,如 果 % 一 ,8 显 然 是 奇异 的 ,如 果 有 两 个 特征 
值 十 分 全 近 ,那么 刀 是 病态 的 ， 我 们 可 以 招 和 矩阵 了 平衡 为 矩阵 C， 


aa 一 1 


1 pp 网 … 


2 7 
Cc 一 | 卫生 生生 本 | 其 中 古 一 Na (22.4) 


aa 


1 ps 
它 的 逆 矩 阵 的 最 大 元 素 可 以 作为 C 的 条 件数 的 一 个 合理 的 估计 。 
矩阵 C 是 一 个 Vandermonde 矩阵 ,可 以 证 明 , 如 果 Z 是 它 的 逆 , 那 
么 


Bar Pes ri), 22.5 
to/ I m1) (225) 
其 中 志 , 定义 为 

I Gm = Spy (22.6) 


对 于 某 些 标准 的 特征 值 分 布 的 C 的 条 件 


23. 现在 我 们 信 计 一 些 20 阶 矩 阵 C 的 条 件数 ， 其 特征 值 分 布 
是 标准 的 。 
GD 线性 分 布 5 一 21 一 7 
我 们 有 
[1/He |= D0 03D 
当 r 一 10 或 11 时 ,其 最 大 值 约 为 4 .102 因为 某 些 系数 bu， 是 


10 的 数量级 ,我 们 看 出 Z 有 某 些 元 素 大 于 10”。 
(ii) 线性 分 布 和 一 11 一 r。 
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现在 我 们 有 


/Ne 


= 10/ ~ D1(20 ~ 7)1. 


{23.2) 
它 比分 布 (i) 得 到 的 值 小 ， 它 们 差 一 个 因子 10-*， 并 且 相应 的 量 
lp 也 较 小 。 条 件数 至 少 差 一 个 因子 10- 
(过 ) 几何 分 布 如 一 2 一 。 
对 于 r 一 20, 我 们 有 
1/H ~ £m)| -29/7 — 27) 
* (27 270) .27 2770) 
> 29/2727.. 27 
一 20 (23.3) 
现在 Ps, 几乎 等 于 1, 因此 C 的 条 件数 必定 像 2"' 那样 大 . 
(iy) 环形 分 布 4, 一 exp(rai/10). 
对 于 这 种 分 布 
| 7 区 ea- va (对 一 切 5)。 (23.4) 
并 且 所 有 的 p, 的 模 都 是 1。 所 以 这 个 矩阵 是 十 分 良 态 的 ， 我 们 


可 以 期 望 特征 多 项 式 的 系数 被 确定 到 运算 精度 那样 准确 ，( 注 意 ， 
如 果 我 们 假定 4 是 对 角 和 矩阵 就 必须 用 复 运算 ,因为 罗 是 复数 .》 


如 果 4 不 是 对 角 矩 阵 ,但 是 
4 一 tdiag (4)H, (23.5) 
那么 
br A'bo = Hr diag (HHHbo). (23.6) 


用 初始 向 量 如 ~ HT'e。 产生 的 矩阵 4 的 序列 等 于 用 HT! 乘 以 用 
e 为 初始 向 基 的 diag (2) 的 序列 。 我 们 不 能 期 望 与 4 对 应 的 矩 
阵 比 与 diag (ht) 对 应 的 更 为 良 态 。 因此 ， 邯 虞 用。 作为 初始 向 
量 的 意义 时 ,我 们 只 限于 用 diag (2), 

显然 , 当 特 征 值 有 很 大 差别 时 ,序列 中 后 面 的 向 量 的 较 后 的 分 
量 很 小 。 下 述 例子 表明 , 这 个 困难 是 本 质 性 的 ， 企 图 寻找 某 个 如 
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使 得 8 为 良 态 是 必然 要 失败 的 。 
对 于 分 布 (i) 的 铺 况 ,我 们 可 以 考察 用 
B20, 1970, 1) {23.7) 
帮 初 始 向 量 的 效果 ,zo 中 含有 充分 的 对 应 小 特征 值 的 成 分 。 然 后 
我 们 有 


现 一 (1 1) (23.8) 
和 
码 一 20of1， (19/20)", (18/20)®, +…-, C1/20)°], (23.9) 
这 里 ,相应 于 大 特征 值 的 成 分 变 得 明显 .对 应 的 平衡 矩阵 C 现 在 是 
20-2 20 "1 1 1 1 
19- 19- .1 19/20:.. (19/20) 
;| |: : 一 0" 《比如 说 )。 
2 2 1 2120 +7 (C2720) 
1 1 1 1/20 … (1120) 
(23.10) 
显然 ,如 果 我 们 定义 对 角 撼 阵 D, 和 D; 为 
D, = [1, (19120)9 (18120)8。，… (1720)8]。， (23.11) 


D, 一 [20°, 20，… -20 1, 1，…1， {23.12) 
那么 用 D1C'D: 与 我 们 用 一 < 得 到 的 矩阵 相同 。 因此 新 的 逆 
立 用 汝 的 逆 表 示 有 如 下 关系 

Y = DZD,, (23.13) 
且 Y 仍然 是 十 分 病态 的 . 


级 小 于 n 的 初始 向 量 


24. 郑 察 一 下 初始 向 量 的 级 m 小 于 ”时 实际 计算 中 会 发 生 什 
么 情况 是 有 益 的 ， 我 们 首先 从 理论 上 来 讨论 ， 我们 有 


Derbiton—0 (m<n), {24.1) 


因此 用 47 左 丝 (24.1) 得 到 
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mt 


TY abs t bmrs —0 C=0, 1 nm) (24.2) 
fel 


这 证 明了 任何 * 十 ! 个 接连 的 如 满足 同样 的 线性 关系 。 显然 方 
程 


BP——b, (24.3) 
是 相 容 的 ,因为 从 关系 (24.2) 得 出 rank (8B) 一 rank (B166) 一 mm。 
因此 ,我 们 可 以 任意 选取 pm，poro …'，bp- 然后 确定 P， 
扣 ，** Pm-t， 解 的 一 般 形式 可 议 从 方程 《24.2) 推导 出 来 。 事 实 
上 ， 如 果 我 们 取 gs 一 4，1，*…*, 4 一 泊 一 1) 为 任意 值 而 取 
9-m 一 LI 用 4 清 (24.2) 中 对 应 的 方程 并 相 加 ,我 们 得 到 


nt 


BD pi tb ~ 0, (24.4) 


其 中 pi: 是 
(sot ert 二 cm"! 十 x™) 
“(qo 二 rt 
的 展开 式 中 x’ 的 系数 。 因为 有 # 一 mw 个 任意 常数 , pi; 代表 (24.3) 
的 通 解 ,因此 由 
(eo 十 cl 十 cm" 十 1”) 
“fg 十 9 十 十 Gn-m_td™ mt A mm) (24.5) 
给 出 对 应 的 多 项 式 
名士 pi 十 -十 
并 且 它 有 一 个 因子 是 和 的 最 小 多 项 式 ,其 他 的 因子 是 任意 的 。 

在 实际 计算 中 、 如 果 我 们 不 去 识别 提前 出 现 的 线性 相关 性 而 
继续 执行 过 程 直 到 计算 出 6,, 那么 当 Gauss 消去 是 像 $21 描述 的 
那样 执行 时 ，U， 的 右 下 和 角 的 《s 一 m) 阶 三 角形 将 完全 是 由 “小 ” 
元 素 而 不 是 零 元 素 构 成 ; w。 的 后 (x 一 m) 个 元 素 可 能 是 小 的 . 
因此 ,我 们 对 p,-, fe-s，"…, Pw 得 到 或 多 或 少 随机 的 值 。 然 而 、 
对 应 的 变量 

Pos Pis «3 Pmt 
将 由 三 角 型 方程 组 的 前 "个 方程 正确 地 确定 。 因此 , 计算 的 多 项 
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式 有 因子 
二 


而 (= 一 m) 次 的 其 他 的 因子 是 相当 任 意 的 。 


实际 的 经 验 


25. 以 上 几 节 的 结果 已 在 DEUCE 机 上 的 程序 中 得 到 实际 的 
验证 。 为 了 补偿 我 们 预料 到 的 矩阵 了 的 病态 , 程序 用 了 双 精 度 定 
点 运算 。 

我 们 从 关系 

to Bi 一 cr cm kb (25.1) 
计算 两 个 序列 如， 如， bn 和 co co cos 其 中 tt 是 一 
个 常数 ,我 们 选取 它 使 得 eralls 一 1。 原 矩阵 4 的 元 素 只 是 单 精 
度 的 ,在 形成 4c, 时 , 先 作 准确 的 内 积累 加 然后 使 人 ;这 仅 需 要 用 
双 精 度数 (62 位 二 进位 ) 冬 单 精度 数 的 汪 法 。 因为 我 们 始终 用 原 
和 矩阵 4 运算 ,我们 可 以 充分 利用 可 能 存在 的 零 元 素 ， 我 们 用 双 精 
度 定 点 运算 解 方 程 


(ci ci ee- 一 一 ca (25.2) 
最 后 用 双 精 府 浮 点 运算 从 关系 式 
Pktikern ka = ge (25.3) 
计算 特征 多 项 式 的 系数 p,。 


我 们 采用 了 像 521 所 描述 的 那样 的 手段 ， 希 望 尽 早 发 现 线性 
相关 人 性。 所 有 绝对 值 小 于 给 定 限 值 的 元 素 都 用 零 代 替 ， 如 有 果 在 革 
一 步 一 列 全 为 零 , 线性 相关 就 发 生 了 ， 《规范 化 如 给 出 ,是 方便 
的 ,甚至 全 用 汉 精 度 浮 点 运算 也 是 如 此 .) 为 了 促使 尽早 出 现 线性 
县 关 , 我 们 先 用 4 乘 初 始 向 量 若干 次 , 使 在 所 得 的 向 量 中 , 小 特征 
售 对 应 的 特征 向 量 成 分 被 前 减 掉 。 从 我 的 经 验 看 来 , 这 个 技术 不 
是 十 分 令 人 满意 的 。 在 任何 情况 下 , 我 都 不 用 它 来 计算 矩阵 的 全 
部 特征 向 量 ， 实 际 计算 中 我 们 得 到 了 以 下 的 结果 .。 

(i) 使 用 对 钊 短 阵 diag (2) (2 一 21 一 +) 和 初始 向 量 “， 
特征 方程 系数 中 最 准确 的 有 13 个 正确 的 二 进位 ,最 差 的 有 10 位 。 
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这 大 致 是 我 们 可 能 期 望 的 结果 ， 因 为 矩阵 C 的 条 件数 是 10s 数量 
级 .用 (23.7) 式 的 初始 向 量 ， 最 精确 的 系数 有 15 位 正确 的 二 进 
位 ,最 差 的 有 11 位 。 所 导出 的 两 个 方程 对 于 确定 矩阵 特征 值 都 是 
没有 用 处 的 ( 见 第 七 章 $6). 
(ii 对 一 个 一 1 一 + 的 21 阶 的 对 角 挎 阵 ， 及 初始 向 量 
<， 计 算 的 特征 多 项 式 的 系数 至 少 有 30 位 二 进位 正确 ， 有 一 些 
更 精确 ， 这 样 的 结果 足以 用 来 确定 特征 值 精度 达到 20 位 二 进 
位 . 
(证) 对 于 4, 一 2 的 分 布 ， 用 一 些 不 同 的 初始 向 量 计算 的 
特征 方程 与 真 的 方程 毫 无 关系 ， 
(iv) 不 用 复 运算 ,对 于 分 布 4, 一 exp(rzi/10) 作 试 验 , 我 们 
用 了 有 10 个 形 如 
cosp,, sin8, 
一 ab。 cos0, | (~™ 7"/10) 25 
的 块 的 三 对 角 人 矩阵， 以 «为 初始 向 量 , 计算 的 结果 中 特征 方程 有 
60 位 二 进位 正确 ,特征 值 也 达到 同样 的 精度 。 
对 于 重 特征 值 或 很 靠近 的 特征 值 的 茶 些 简单 的 分 布 ， 通 常 得 
到 的 特征 值 ,只 有 某 些 是 正确 的 ,而 有 一 些 完全 是 任意 的 值 。 这 证 
实 了 $24 的 分 析 。 


广义 Hessenberg 方法 


26. 我 们 研究 了 Krylov 方法 , 结果 表明 仅 当 特征 值 分 布 很 好 
的 时 候 ,这 个 方法 才能 给 出 好 的 结果 .但 是 我 们 应 该 提出 ,来 自 阻 
尼 机 械 和 电子 振荡 的 矩阵 , 其 特征 值 的 分 布 一 般 都 是 好 的 。 这 种 
矩阵 的 特征 信 通 常 是 复 共 示 对 。 

为 了 扩大 适用 范围 ,已 经 寻找 到 Krylov 向 量 序列 “稳定 化 ”的 
方法 .这些 方 法 可 以 续 人 “广义 Hessenberg 方法 ”的 标题 之 下 . 
这 些 方法 都 是 以 了 述 思想 为 基础 。 

给 定 一 组 ”个 线性 无 关 的 向 量 =*， 它 是 矩阵 X 的 列 。 从 任意 
向 量 所 开始 ,我 们 用 关系 
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bb = Ab — Dy Birbs (26.1) 
后 


构成 一 组 修正 的 Krylov 向 量 5 刀 ，:…*， pert 《既然 我 们 不 再 
关心 直接 决定 特征 方程 ,初始 疝 量 记 为 占 比 记 为 名 更 方便 .) 为 了 
数值 计算 方便 , 我 们 引信 规 格 化 因子 《+ 我 们 确定 各 使 得 bes 
与 mn， -zy 正 交 ， 如 果 前 面 没有 出 现 b' 是 零 , 那 么 544s 必 
定 是 零 , 因 为 它 与 = 个 独立 的 向 量 正 交 .方程 《26-1) 可 以 写 为 一 
个 拢 阵 方程 
Alb rib 一 [032 i6,] 
A 
ky Bay bas hres han 
0 6 hy eo hes he | 


2 2 26.2 
0 0 0 如 on 0) 


部 
AB 一 BH, (26.3) 
其 中 乱 阵 太 是 上 Hessenberg 型 。 
从 方程 的 两 边 第 ” 列 相等 并 与 (26.1) 比较 可 以 看 出 , 方程 
(26.2) 包 含 著 5。4s 是 零 的 条 件 . 这 个 正 交 条 件 可 以 写 为 
XTB 一 了 工 ， (26.4) 
其 中 工 是 下 三 角形 虐 阵 .假若 3 是 非 奇异 的 , 方程 (26.3) 可 以 记 
为 形式 


了 -4B =—H. (26.5) 

为 方便 起 见 , 我 们 已 假定 xi 预先 给 定 ， 在 上 面 的 推导 中 没有 

要 求 这 个 条 件 ， 事 实 上 ， 在 我 们 用 任何 适当 的 方法 决定 纪 的 同时 
导出 xi。 


广义 Hessenberg 方法 的 失败 


27, 有 潍 个 不 同 的 原因 会 使 我 们 则 才 讨 论 的 方法 发 生 故 障 ， 
GD 向 景 br1 (+ < n) 可 能 是 零 ， 如 果 它 是 零 , 我 们 可 以 用 
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任何 一 个 与 my x， zx 正 交 的 向 量 crt 代替 霍 向 量 bu, 用 
下 述 关系 定义 一 组 新 的 向 量 我 们 可 以 使 记号 保持 一 致 . 


Gb bn - 写 hit Rope br (Brrr 0), 
大 


cs 是 与 ai.…,。 xy 正 交 的 任 一 个 非 夫 向 量 《Bw 一 0 ， 
(27.1) 
如 果 当 ns 是 零 时 ,我 们 取 名 一 0， 那 么 关系 名 term mm bs 仍 
然 正确 . 
从 这 些 定义 我 们 有 
4C 一 CH， Xx'ic—l. (27.2) 
对 于 每 一 个 零 向 量 户 , 在 太 中 有 一 个 对 应 的 零 元 案 镶 ， 现 在 我 们 
看 出 零 向 最 的 出 现 可 以 不 认为 是 方法 的 故障 ， 它 只 是 过 程 继续 二 
去 需要 作 的 某 种 选择 ， 
实际 上 ,在 这 种 情况 下 , 鼠 的 特征 值 计算 是 更 简单 些 。 因 为 当 
一 个 是 零 ， 互 的 特征 值 是 两 个 较 小 的 矩阵 的 特征 值 ， 从 现在 
起 , 我 们 用 ci 讨论 这 个 方法 . 
(ai) 上 玉 的 元 素 是 从 关系 式 
A [sac 一 D3 iis] /Tey (27.3) 
导出 的 ， 如 果 xtc: 是 零 ， 那 么 我 们 就 不 能 确定 Ar。 显然 zc 变 
为 零 的 故障 比 上 面 提 到 的 5 为 零 的 故障 严重 得 多 。 如 果 mm 不 是 
预先 给 定 的 ， 我 们 可 以 选取 x; 使 得 zc, 不 为 零 . 在 x; 是 预先 给 
定时 ，xge; 为 零 的 确 是 致命 的 ， 唯 一 的 解决 办 法 似乎 是 另 选 初始 
向 重重 新 开始 。 怎 样 选择 如 使 过 程 不 会 产生 故障 是 一 个 有 意 
义 的 研究 课题 。 
值得 注意 的 是 ,从 (27.2) 我 们 有 i 一 好 ci。 如 果 没 有 43ci 等 
于 零 , 那 么 工 是非 奇 异 的 ,因此 C 也 是 非 奇异 的 . 


* 原文 h4 一 “dcrfxye 有 误 .一 一 译 者 注 
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Hessenberg 方法 


28. X 的 一 个 自然 的 选择 是 取 为 单位 给 降 , 然后 我 们 有 一 
e#。 这 样 给 出 的 就 是 Hessenberg 方法 (1941)， 现 在 (27.2) 的 第 二 
个 方程 变 为 
工 一 XITC 一 C. (28.1) 
因此 , C 本 身 是 下 三 角 型 ， 亦 即 ,的 前 〈* 一 1) 个 分 量 都 是 零 . 
我 们 可 以 选取 入 使 得 的 第 > 个 分 量 是 1. 并 记 
To (0 0，1， prkor 3 Hs)s (28.2) 
这 样 记 的 理由 下 面 会 明白 。 方 法 的 第 步 如 下 . 
计算 4c 一 般 它 没有 雷 元 ， 然 后 逐次 地 减 去 c, 的 倍数 把 第 
一 个 元 素 消 去 , 减 去 c; 的 倍数 消去 第 二 个 元 素 ,…, 最 后 减 去 <, 的 
倍数 消去 第 “个 元 素 ， 这 样 给 出 了 向 量 ,1。 我 们 到 4 为 bps 
的 第 (+ 十 1) 个 元 素 , 这 使 得 cv+， 是 (28.2) 的 形式 .如 果 4 
是 器 ,我 们 可 以 取 crys 为 如 下 形式 的 任何 向 量 ， 
(0, 0, 23 0 1 etartis 7° nrts), (28.3) 
因为 它 与 ce， er 自动 地 正 交 ,对 应 的 和 ts 的 值 是 零 . 这 
相当 于 $27 中 的 情况 (i。 
如 果 5+! 不 是 零 , 但 它 的 第 〈r 十 1) 个 元 过 是 零 ,我 们 不 能 
用 上 面 叙 述 的 方法 规范 化 br 来 得 到 com。 不 管 我 们 用 什么 规 
范 化 因子 ， 我 们 都 有 cituerws 一 0， 因 此 过 程 在 下 一 步 就 中 断 了 。 
这 种 状态 相当 于 $27 的 情况 〈ii), 


实际 的 方法 


29. 如 果 我 们 取 “为 了 的 列 ,但 不 一 定 按照 它 的 且 然 顺序 , 我 
们 就 能 避免 过 程 中 断 又 保证 数值 稳定 性 ， 到 ”一 cw, 其中， 
2 是 1 2,…，z 的 某 个 排列 也 许 最 好 用 第 + 步 的 具体 描 
述 来 表明 确定 ”的 办 法 。 设 向 量 c，…，< 和 1，…, 六 已 经 确 
定 , 并 且 6: 的 第 1',…, (i 一 1)' 个 元 素 都 是 零 , 那么 第 + 步 的 运 
算 如 下 。 
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计算 4c 逐次 减 去 1， cy，*……, cr 的 倍数 使 第 1 2 
个 元 素 变 为 零 ， 这 样 计算 得 到 的 向 量 是 bn。 如果 和 fi 的 极 大 
元 素 在 第 《〈r + 1)” 个 位 置 上 ,我 们 就 取 这 个 元 素 为 ka， 同时 取 
fi 为 ceby。 显 然 ，crr 的 第 1，…,r' 个 元 案 是 霍 并 且 所 有 非 
零 元 都 不 大 于 1。 如 果 br 是 零 , 我 们 可 以 取 za 为 了 的 任何 与 
放下 交 人 一 1 2 7) 的 列 eriys 取 cr 是 第 7 十 1 个 分 
量 为 1 的 并 且 与 ex(i 二 1, 2,*…, 7+) 正 交 的 任 一 个 向 基 ， 显 然 ， 
形成 置换 矩阵 P( 第 一 章 $40 (i)) 的 列 . 因此 方程 (27.2) 变 为 


4C 一 C，PTC 一 工 ， {29.1) 
其 中 工 不 但 是 下 三 角 型 而 县 是 单位 下 三 角 型 。 因 此 ,我 们 有 
PT4{PPIT)C 一 PICH (29.2) 
或 
(PT4P)(PTC) = (PIC)H, (29.3) 
即 
AL = LH, (29.4) 


其 中 是 4 的 某 个 相似 置换 变换 而 工 是 由 C 经 过 适当 的 行 置换 
得 来 的 。 


Hessenberg 方法 与 以 前 的 方法 的 关系 
30. 如 果 我 们 按照 自然 顺序 用 ci, 那么 我 们 有 


AC= CH, (30.1) 
并 且 用 (28.2) 给 定 的 c;, 我 们 可 以 写 
AN = NH, (30.2) 


其 中 NN 是 单位 三 角形 矩 降 ， 现 在 如 果 我 们 取 初 始 向 量 c; 为 0, 那 
么 我 们 从 §11 看 出 ,矩阵 NN 和 五 与 直接 约 化 矩阵 为 Hessenberg 型 
所 导出 的 矩阵 相等 。 如 果 我 们 想 用 4 的 相似 变换 ,那么 在 Hessen- 
berg 方法 中 取 c 为 第 一 分 量 为 1 的 任何 其 他 向 量 ,这 等 价 于 预先 
引入 了 一 次 变换 N,ANT'。 

在 $29 中 描述 的 实际 方法 完全 等 价 于 有 交换 的 直接 约 化 为 
Hessenberg 型 的 方法 。 注意 ,529 的 7 不 是 $12 的 7', 但 是 $12 
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的 二 使 得 Pr7a lv-uo-or 一 P， 事 实 上 , 我 们 容易 把 $29 的 
乌 述 重新 整理 使 得 我 们 在 每 一 阶段 对 4 执行 同样 的 行 , 列 交换 ,对 
5 的 当前 的 矩阵 执行 行 交换 而 不 用 基 种 置换 后 的 “*。 这 两 个 方法 
不 仅 在 数学 上 等 价 ,而 且 如 果 有 内 积累 加 运算 , 那么 ,它们 连 舍 人 
误差 都 一 样 。 

因此 ， 我 们 不 必 单独 对 Hessenberg 方法 作 误 差分 析 了 ， 但 
是 ,我 们 要 用 适合 现在 的 方法 的 术语 来 叙述 一 些 以 前 得 到 的 结果 。 
为 叙述 方便 ,我 们 假定 在 每 一 阶 眉 中 4 和 向 量 是 实际 作 置 换 的 . 

(i) 在 某 种 意义 上 来 说 交换 行列 是 本 质 性 的 ,这 就 是 说 , 如 果 
不 用 它 , 我 们 可 能 得 到 向 量 <1 的 任意 大 的 元 素 zw， 并且 导致 精度 
的 极 大 损失、 

(Ga) 如 果 在 任 一 阶段 ， 向 量 5 的 第 ;个 到 第 # 个 元 素 都 小 ， 
那么 尽管 mw 是 用 小 的 数 的 比值 计算 的 ,所 得 的 结果 精度 没有 受 损 
失 . 我 们 最 后 得 到 的 矩阵 太 是 劣 定 的 . 我 们 不 想 再 为 突出 这 点 多 
加 解释 曾经 有 人 提议 , 当 这 种 情况 出 现时 ,我 们 应 该 用 男 一 个 不 
闻 的 初始 向 量 起 新 开始 ,从 而 避免 这 种 情况 再 出 现 , 但 是 这 样 的 措 
施 绝对 没有 任何 充足 的 理由 。 

( 放 ) 如 果 计 算 的 Bt 是 零 , 那 么 我 们 可 以 取 crn 一 em。 这 
相当 于 , 当 a 一 0 GG 一 7 十 1，，…,#) 时 , $8 中 矩阵 Ne 可 
以 取 为 单位 矩阵 , 旭 然 我 们 是 可 以 取 任何 矩阵 的 。 


Arnoldi 方法 
31. 在 广义 Hessenberg 方法 中 , 一 组 向 量 ”的 另 一 个 自然 的 
选择 是 ci 本 身 。 这 种 选择 导出 了 Arnoldi 方法 (1951)， (27.2) 
的 第 二 个 式 子 现在 变 为 
CTC 一 了 (31.1) 
其 中 也 是 下 三 角 型 又 是 对 称 的 , 因而 是 对 角 和 矩阵 ， 我 们 可 以 选取 
规范 化 因子 使 CTC 一 1, 因而 得 到 一 个 正 交 知 阵 。〔 这 种 做 法 与 


规范 化 使 每 个 |ci| 的 元 素 在 了 和 1 之 闻 的 办 法 相 比 好 处 很 小 ,而 


397。 


后 者 比较 节省 。 但 是 ， 我 们 将 君 到 规范 化 CTC = 一 ! 揭示 了 一 个 
和 议 前 的 方法 的 有 趣 的 关系 .) 现在 我 们 假定 C 不 是 对 称 的 ,因为 
对 称 的 情况 在 $ 40 中 要 另 作 讨论 ， 

如 果 我 们 取 «为 4、 那么 对 一 个 它 的 第 一 列 是 “ 的 正 交 和 矩 
阵 C 我 们 有 

AC— CH. (31.2) 

因此 ,从 好 我 们 着 出 , C 和 互 本 质 上 是 Givens 变换 和 Householder 
变换 所 产生 的 矩 隆 


实际 的 考虑 


32. 虽然 用 规范 化 CTC 一 了 的 Arnoldi 方法 与 Givens 方法 
和 Howscholder 方法 是 紧密 相关 的 ， 但 是 它们 的 计算 过 程 没有 什 
么 共同 之 处 。 现在。 我 们 详细 地 讨论 其 实际 过 程 。 我 们 不 必 假定 
“是 。 而 是 令 它 为 任 总 给 定 的 规范 化 向 量 ， 我 们 首先 考 虞 如 下 
定义 的 向 量 ts. 

Br = Acr — hc — hres — 0 — hirers {32.1) 

其 中 如 被 选取 为 使 得 br 与 cr Gi 一 1，…， +) 正 交 ， 现 在 我 们 
计算 &rs 时 可 能 发 生 严 重 的 相约 ， 并 且 使 得 如 1 的 所 有 分 量 比 
14e 小 得 多 。 在 这 种 情况 下 ， 加 + 甚至 不 能 与 ct 近似 正 交 ， 
(比较 第 四 章 555 关于 Schmidt 正 交 化 的 类 似 现象 

现在 应 该 保持 = 严格 正 交 ， 准确 度 达 到 运算 精度 ， 这 是 本 质 
性 的 ,否则 将 可 能 保证 crs 在 运算 精度 的 意义 下 是 霍 。 产生 困难 
的 厌 因 不 应 归结 为 会 信 误差 的 积累 ， 因 为 计算 一 个 二 阶 乱 阵 的 第 
一 步 就 可 能 发 生 这 种 肉 准 ! 表 3 的 例子 说 明了 这 个 现象 ， 当 我 们 
计算 


b= Act — huc 
时 发 生 几 乎 完全 的 相 消 , 结果 5 当然 不 正 交 于 c;。 如 果 我 们 不 管 
它 , 规 范 化 5 再 继续 作 下 去 , 我 们 发 现 ， 假 如 4 和 ;几乎 准确 正 
交 的 话 , 应 该 是 零 了 ， 但 实际 上 不 是 。 矩阵 互 与 4 根本 不 相似 
(我 们 已 用 块 浮 点 运算 来 计算 , 但 并 没有 和 任何 实际 意义 ,不 管用 什 
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表 3 


人 

.41323 0.61452 

0.54651 0.21374 
没有 再 正 交 化 的 Arnoldi 方法 

a Acer Bb 

人 .78289 0.70584 0.00004 
0.62216 0.56084 —0.00006 
A = 0.90153 = 40 《0.72111) 


cs Mos Aes— bcs bs Acs— hacr 一 hascs 
0.55470 一 0.28209 一 0.17023 一 0.01899 
一 9.83205 0.12531 0.21420 一 0.01266 
hs = 一 0.14288 ia 一 一 0.27265 
HH 


| 0.901353 一 0.14288| 
10-C0.72111) 一 0.27265| 
有 再 正 交 化 的 Arnoldi 方法 
a Acy CA 
0.78289 0.70584 -0.00004 107+ (C0.44708》 
0.62216 0.56084 一 0.00005 10-《—0.56258) 


hr = 0.90153 Ks = 10°0.71859) 
es Acy hts 一 hc: bs = Acs— he — fre 
0.62216 一 0.22401 一 0.17082 0.00000 
一 0.78289 。 0.17268 。 0.21495 0.00000 
hs = .06794 ha = ~0.27456 
H 
0.90153 ~0.06794 


10-4C0.7i859) ~—0.27456| 


么 类 型 的 运算 ， 同 样 的 困难 还 会 发 生 ,) 追 迹 是 0.62888 而 不 是 
0.62697, 人, 的 数量 级 是 2 x 10, 而 不 是 原来 的 10 

现在 假定 我 们 再 作 正 交 化 , 使 计算 向 量 性 与 4 正 交 , 我 们 可 
以 写 
ba Biicis (32.2) 
为 了 正 交 性 我 们 有 


Bu = ca (32.3) 
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现在 因为 六 已 经 再 一 次 关子 c 作 了 正 交 化 ， 我 们 可 以 肯定 su 是 
10… 数量级 ， 因 此 ,我 们 有 


bt OC(10), (32.4) 
但 是 原来 的 正 交 化 能 保证 5; 满足 关系 
b= A — uc t+ O(10™), (32.5) 
由 此 
B= Ac— huc + OC(10™), (32.6) 


因此 ， 重 新 正 交 化 不 但 不 会 给 如，4c! 和 c, 之 间 的 关系 带 来 任何 
不 良 影响 , 而 且 使 如 与 “的 正 交 性 达到 运算 精度 , 即 它们 之 间 的 


夹 第 与 二 的 差 是 10…" 的 数量 级 。 


这 是 表 3 所 显示 的 事实 ， 从 如 计算 规范 化 向 量 , 我 们 有 
bc 一 Bi, {32.7) 
现在 因为 c 和 <, 几乎 正 交 ， 因 此 对 于 运算 精度 来 说 包 实际 上 是 
零 。 值 得 注意 的 是 ,现在 计算 的 量 满足 
和 ci 一 dc 一 pacl 十 D10 7)， (32.8) 
b= 0(105) = Ac — hac — hoc + O(10™), (32.9) 
结果 
hu hy 
Ra ha 
这 是 我 们 能 期 望 的 最 好 结果 ， 这 表明 计算 的 五 现在 与 4 几乎 准确 
相似 。 注 意 , 追 迹 的 准确 性 被 保持 为 运算 精度 , 并 且 可 以 验证 , 通 
过 所 作风 变换 计算 的 特征 值 积 特征 向 量 也 可 达到 运算 精度 。 


Alaial = [oien [2 | + oGoD， C3210) 


再 正 交 化 的 重要 性 


33. 为 了 得 到 确实 与 < 正 交 的 向 量 名, 我 们 对 如 用 了 Schmidt 
正 交 化 方法 。 重要 的 是 要 认识 到 用 这 种 办 法 得 到 的 如 的 校正 不 
是 使 结果 令 人 满意 的 唯一 的 校正 。 我 们 所 需要 的 是 应 该 作 一 个 校 
正 ,其 数量 级 是 10 或 更 小 的 校正 , 并 且 使 总 几乎 准确 地 与 正 
交 。 例如 , 包 给 定 为 
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-100.43814, —0.55133), (33.1) 
它 丛 巧 给 出 与 再 正 交 化 得 到 的 结果 一 样 好 ， 在 规范 化 后 它 给 出 c 
使 得 (32.8) 满 足 ， 相 约 的 结果 是 给 了 我 们 一 些 关 于 如 选取 的 自由 
度 、 在 Wilkinson 《1963 b), p.86 ~p.91 中 ,我 们 证 明了 即使 我 们 
用 再 正 交 化 ,在 发 生 相 约 时 ,最 后 的 矩阵 C 和 互 是 强烈 地 依赖 运算 
的 精度 的 . 
一 般 来 说 ,最 简单 的 过 程 是 用 下 述 公式 先 计 算 纪 .ray 
Bri Ace ~ hrc hyrcy ~ oo — irers (33.2) 
然后 计算 ri, 使 得 


Br br — Eyci — Exc — + ~ Bery 《33.3) 
Kner Bn el 1， (33.4) 

其 中 
Bir = corul lei = cher (33.5) 


如 果 4 是 规范 化 矩阵 并 且 用 : 位 计算 ,那么 我 们 有 
Alaiciseien) = (olciic)H + Os), (33.6) 
0(2™) 的 精确 含义 已 经 故意 弄 得 模糊 ， 通 常 它 是 范 数 以 信 n)2™ 
为 界 的 逢 阵 , 其 中 (wn) 与 使 用 的 运算 类 型 有 关 。 因 子 fn) 能 合 
理 地 归结 为 伟人 误差 的 积累 。 对 于 有 内 积累 加 的 浮 点 计算 , 一 个 
粗略 的 估计 证 明 f(x) < Km, 但 是 这 个 结果 也 许 能 改进 、 
必须 作 再 正 交 化 的 根本 原因 是 相约 而 不 是 使 人 误差 的 积累 . 
我 们 已 用 了 一 个 二 阶 矩 阵 的 例子 说 明 强 调 这 一 点 的 原因 。 如 果 在 
任何 阶段 都 没有 发 生 相 约 ,再 正 交 化 可 以 安全 地 略 去 。 可 惜 这 种 
情况 是 罕见 的 . 包含 了 再 正 交 化 的 Arnoldi 方法 远 不 如 House- 
holder 方法 节省 。 没有 再 正 交 化 的 方法 需要 24: 乘法 。 而 有 再 正 
交 化 的 需要 3”” 次 乘法 〈 这 里 我 们 又 看 到 第 四 章 $55 中 Schmidt 
正 交 化 与 Houssholder 方法 的 比较 ), 没 有 再 正 交 化 的 Arnoldi 方 
法 可 能 给 出 非常 差 的 结果 , 即使 用 于 良 态 的 矩阵 也 是 如 此 。 可 是 
引入 再 正 交 化 后 ，Arnoldi 方法 与 Householder 方法 在 精度 上 是 
可 以 绚 美的 。 如 果 我 们 偶然 选取 了 扬 ， 它 缺乏 或 完全 欠缺 某 些 特 


年 向量 的 成 分 ， 这 个 精 膏 也 装 不 会 如 减 。 
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我 们 又 一 次 遇 到 这 种 情况 ,用 准确 的 计算 , 当 5 变 为 零 时 , 我 
们 完全 能 自由 决定 c, 的 “全 部 数字 ”， 仅 仅 要 求 它 与 前 面 的 “ 正 
交 , 而 对 于 有 限 精 度 的 计算 , 现 为 相约 有 天 位 变 为 零 时 , 我 们 可 以 
有 效 地 任意 选择 * 一 《位 数字 。 注 意 , 因为 xJc 一 cfc; 一 1, 在 
Arnoldi 方法 中 我 们 不 会 有 $27 中 介绍 的 第 二 类 失败 . 

34. 关于 再 正 交 化 自然 要 提出 两 个 问题 

(i) 为 什么 在 Hessenberg 方法 中 没有 青 正 交 化 问题 ? 

《7 我 们 知道 ，Givens 方法 和 Householder 方法 在 数学 上 与 
Arnoidi 方法 是 等 价 的 ， 在 这 两 个 方法 中 ,是 什么 东西 代 奉 了 再 正 
交 化 呢 ? 

读者 必须 十 分 清楚 地 了 解 这 些 问题 ， 现 在 我 们 详细 地 讨论 它 
们 。 关 于 第 一 个 问题 ,我 们 注意 到 ,如 果 cy 由 下 式 定义 

Rptrti 一 4er 一 re 一 一 cry (34.1) 
那么 只 要 coy 一 0, 我 们 就 有 
AC=CH. {34.2) 
但 是 , hir 可 以 是 已 选择 好 了 的 。 选 取 hi 使 得 “+: 与 独立 的 向 量 
改正 交 是 重要 的 。 这 是 因为 它 保证 了 c; 是 独立 的 向 量 并 且 co+: 是 
零 . 现在 当 + 是 向 量 et 时 ， 只 有 取 “; 的 基 些 特 宝 的 分 量 为 准确 
的 零 ,准确 的 正 交 性 才能 保证 . 因此 , 我 们 得 到 准确 的 正 交 性 , 但 
是 几乎 没有 意识 到 这 一 点 ， 对 思 的 大 多 数 选择 法 精确 的 正 交 性 
不 能 以 这 样 简单 的 方式 来 达到 ,通常 还 包含 大 量 的 计算 。 可 是 , 当 
X 是 任 一 个 非 奇异 的 上 三 角形 第 阵 时 , 向 量 c; 与 对 应 X 一 了 的 完 
全 相同 。 事实 上 ,在 这 种 情况 下 , 车 ci 与 za :xz 正 交 , 它 
的 前 ?个 分 量 必定 是 准确 地 为 零 。 当 我 们 从 关系 
Brrt = Acs— hci — byt — + — her (34.3) 
计算 各:: 时 ,我 们 不 必 参 考 x, 的 实际 成 分 。 我 们 首先 从 4er 减 去 
ec 的 和 倍 使 第 一 个 分 量 消去 ,这 就 建立 了 对 x 的 正 交 性 , 接着 减 
去 6; 的 jx 倍 俩 第 二 个 分 量 消 去 并 且 保 持 第 一 个 分 量 为 零 。 继续 
这 样 作 ,我 们 就 得 到 如 ,4s 它 的 前 > 个 分 量 为 零 , 因此 与 xs ……， 
zr 正 交 。 
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第 二 个 问题 更 为 微妙 , 由 Arnoldi 方法 得 到 的 向 量 c/ 等 价 于 
在 Givens 方法 或 Householder 方法 中 例 部 正 交 变换 答 阵 祖 癸 得 
到 的 矩阵 的 列 。 在 第 三 章 我 们 扒 述 过 比较 简单 的 方法 , 它 能 保证 
各 个 因子 是 正 交 的 , 其 准确 性 达到 运算 精 府 。 在 Arnoldi 方法 中 
变换 矩阵 不 是 因子 化 的 ,而 是 逐 列 直 接 决 定 的 。 在 这 种 情况 下 ,用 
来 给 出 的 正 交 性 的 数值 方法 是 十 分 无 效 的 。 


Lanczos 方法 


35. x 还 有 另外 一 种 选择 方法 ， 这 种 选 法 在 实际 计算 中 是 十 
分 重要 的 。 在 这 种 选择 法 中 , x; 和 ,ci 是 以 与 从 4 导出 “ 相同 
的 方式 同时 从 47 导出 ， 我 们 首先 研究 准确 的 数学 方法 。 因为 c, 
和 x 有 着 十 分 紧密 的 关系 , 所 以 采用 反映 这 一 特点 的 记号 就 很 方 
便 , 按照 Lanczos (1950) 的 文章 , 我们 记 好 ,cy 是 从 47 导出 
的 向 量 , 我 们 特别 指出 这 一 节 中 星 号 不 表示 转 置 共 元 。 有 关 的 方 
程 是 


天 :crtl bn — Ac 一 位 hicis (35.1) 
t=] 


籁 = 1 二 ATe? 一 了) 胡 c， {35.2) 


其 中 入 和 各 是 待 选 的 数 ， 它 们 要 选 得 使 or 与 cf cy 正 
交 ; :与 c cr 正 交 .、 
我 们 可 以 把 一 般 性 的 分 析 详 用 到 这 两 个 序列 上 ,因此 我 们 有 
AC = CH, (C*)rC 一 工 ， (35.3) 
ATC*— CH, CTC+ = L*, 
其 中 昌 和 H* 是 上 Hessenberg 型 , 工 积 L* 是 下 三 角 型 。 从 (35.3) 
的 第 二 个 和 第 四 个 方程 我 们 发 现 
Lo (L*), (35.4) 
因此 ,这 两 个 矩阵 都 是 对 角 型 ,我 们 用 DD 表示 它们 。 第 一 个 和 第 三 
个 方程 给 出 


He CAC = DUH)D, (35.5) 
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(35.5) 的 左边 是 上 Hessenberg 型 ,右边 是 下 Hesssnberg 型 .因此 ， 
宫 们 者 时 对 介 理 ,并且 有 

hr=0 (=1,.,r— 2), (35.6) 
这 证 明了 如 果 4c, 与 信和 cz# 正 交 , 就 自动 和 以 前 的 所 有 cy 
正 交 ,对 47c* 有 类 似 的 结果 。 我 们 从 (35.5) 进 一 步 租 到 

有 (35.7) 

因此 , 如 果 乘 数 因 子 K,;, 和 KA: 取 为 1, 那么 和 wii 一 础 "51s 并 且 
旦 和 H* 恒 等 。 因 为 矩阵 态 和 H* 是 三 对 角 型 ,用 下 述 记 号 比较 简 
单 。 


Trtm — br ™ A — res 一 局 cr {35.8) 
Th = Ba = ATe? — ct — Pr es 《35.9) 

其 中 从 (35.7) 有 
php YA (35.10) 


对 于 ws B,, BX 给 出 显 式 关系 式 是 方便 的 , 由 正 交 性 和 (35.9) 我 
们 有 
etr = (es) Acl(et)Te, 一 elATe* /cles {35.11) 
B= (cer) Ac er) es 
一 AT (er er 
一 cyycy 十 octs +t Beeta) /cra)T ers, 


relet (cre (35.12) 


类 似 地 ,有 
Bet) ee a er (35.13) 


过 程 的 故障 


36. 在 转 到 实际 计算 过 程 之 前 ， 我 们 必须 处 理 b+ 或 者 绩 
(或 两 者 ) 是 堆 的 情况 。 这 些 事件 是 完全 独立 的 。 如 果 如 + 是 零 ， 
我 们 取 “c++ 为 任何 一 个 与 沾 cy 正 交 的 向 量 ,然后 如 果 取 
7 一 0 (35.8) 就 成 立 。 类 似 地 ,如 果 妨 ! 是 图, 我 们 取 己 , 为 
任 一 个 与 1,……, cr 正 交 的 向 量 并 且 取 7#: 一 0。 值得 注意 的 
是 ,从 (35.10) 可 知 : 如 果 brrs 是 零 而 2 不 是 零 , 则 6: 是 零 , 然 
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而 如 果 姑 , 是 零 , by: 不 是 零 , 则 8 是 零 。 

利用 乘 数 因 于 Yr 7 各 可 以 明显 看 出 ，5m 或 下 :为 零 不 
应 认为 是 方法 的 故障 。 它 只 是 给 我 们 一 个 选择 的 自由 。 如 果 我 
们 更 乘 数 因子 等 于 1, 那么 5, 或 线 ， 为 等 似 乎 是 一 个 意外 的 情 
况 . 


另 一 方面 在 任何 阶段 如 果 cfex 为 零 , 过 程 将 完全 中 断 ,我 们 
必须 用 新 的 a 或 兴 (或 两 者 ) 重新 开始 作 ， 希 望 不 再 发 生 中 断 . 
可 异 ， 这 种 中 断 又 并 没有 指示 一 种 重新 选择 =: 或 cf 的 可 靠 的 方 
法 . 


现在 我 们 假定 对 我 们 讨论 的 有 关 的 i 值 , c 和 他 满足 cfci 闪 
0, 我 们 证 明 在 这 种 情况 下 如 果 c, 关于 4 是 P 级 的 ,那么 第 一 个 变 
为 零 的 与 是 bor. 
事实 上 ,对 于 r+ ~ 1, 2,，.…,s 反复 使 用 等 式 (35.8), 我 们 可 
得 
Bn = (A + qoAT! T+ gsAT + + ge 
= f(A)a, (36.1) 
其 中 f(4) 是 4 的 :次 首 项 系数 为 1 的 多 项 式 (第 一 章 $18)。 因 
此 ,如 果 :< ,bre: 不 会 是 零 . 现在 ,因为 o， 是 ?级 的 ; 4?c, 可 
以 表示 为 4'ci (i 1,.…,p 一 1) 的 线性 组 合 , 因 此 
bons = folA)a = goa(A)e, {36.2) 
其 中 gsi(4) 是 4 的 一 个 (8 一 1) 次 多 项 式 ， 从 方程 (36.1), 对 
= 1 "一 1, 我 们 看 出 82-:(4)e, 可 以 表示 为 55，，……， 抽 
的 线性 组 合 ,因此 记 是 cr，.……, c, 的 线性 组 合 。 我 们 可 以 写 


2 
Bott = Dy ie. (36.3) 


因为 b+ 与 cc 正 交 ,我 们 有 
0= neo, Da 0 = 1 p). (36.4) 
至 此 ,我 们 的 证 明 全 部 完成 . 
由 此 推论 : 如 果 4 是 减 次 和 的， 必定 过 早出 现 5 为 零 。 类 似 
地 , 引 也 是 这 样 。 
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数值 例子 


37. 我 们 要 着 重 指出 某 个 cJc* 为 零 , 并 不 说 明和 矩阵 4 有 任何 
缺陷 . 即使 4 的 特征 问题 是 良 态 的 , 这 种 情况 也 会 发 生 。 我 们 不 
能 不 认为 这 是 Lanczos 方法 本 身 的 一 个 特殊 弱点 。 

表 4 


5 一 1 0.6 0.6 
A=|—-5 0 1 a=|—1.4 d= 0.3 
10 1 0.3 一 0 
1.5 1.8 
cml 一 2.5 Sot] 1.6] der=0 
3 3 
1.5 一 人 8 


在 表 4 中 , 我 们 给 出 一 个 有 这 类 中 断 的 例子 。 由 于 使 用 规范 化 因 
也 引进 了 伟人 误差 , 我 们 令 所 有 7i。7? 为 1, 因而 所 有 阶段 中 都 
有 “一 bc 一 好 .最 cicf 是 准确 的 零 ,显然 不 管用 了 什么 比 
例 因 子 , 假 如 没有 使 人 误差 的 话 , 它 仍然 是 零 。 对 于 没有 小 整 系数 
的 矩阵 ,如 果 我 们 用 随机 分 量 产生 初始 向 量 , 那么 cje* 准确 地 为 
零 是 极其 罕见 的 。 


实际 的 Lanczos 方法 


38. 如 果实 际 计 算 中 ,用 (35.8) 至 (35.13) 式 执行 Lanczos 方 法 ， 
那么 两 个 序列 C; 和 C# 的 双 正 交 性 通常 很 块 就 丧失 -。 一 旦 形成 
向 量 纪 或 地 时 发 生 大 量 的 相约 ， 正 交 人 性 立刻 就 严重 地 变 坏 、 为 
了 避免 这 种 损失 ， 在 每 一 个 阶段 都 要 执行 再 正 交 化 是 实质 性 的 . 
一 个 方便 的 实际 过 程 如 下 : 

在 每 一 阶段 我 们 首先 用 下 列 式 子 计算 bn 和 好 ru 
bn Acs 一 arer ~ Piceay wm (cr)Ac/(er)e, 

B= (er) Ac (er) Te , 
he 一 ee 
Br = (ceri) ATes/ (cr) em, 


(38.1) 
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独立 地 确定 «的 两 个 什 是 有 好 处 的 , 它 可 作为 计算 的 检查 ， 然 后 
我 们 从 下 述 关系 计算 erts 和 eth. 


Frat Br 一 4 一 enacl 一 80cl 一 … 一 srcr 
er — Btn = bf — Btct — sie — + — etct, 
(38.2) 
其 中 
Br (eH) ble ) es ss chr/eTet, (38.3) 


换 句 话说。 尹 5 是 对 cy， …，cy 再 正 交 化 和 绕 44 对 aer 
再 正 交 化 。 自然 这 是 逐步 执行 的 , 每 个 修正 量 计算 出 之 后 就 立 刘 
被 减 去 ， 不 能 过 份 强调 再 正 交 化 不 会 产生 用 更 精确 的 计算 可 能 得 
到 的 向 量 和 不 良 影响 . 

值得 注意 的 是 , 5,+, 关于 <#_， 和 ce? 再 次 作 正 交 化 与 关于 cf 
……，cy-: 重新 作 正 交 化 是 一 样 重要 , 这 是 因为 必须 再 正 交 化 的 不 
因 是 相约 而 不 是 爹 人 误差 。 我 们 可 以 方便 地 选择 因子 Yi 和 74， 


是 2 的 壬 , 合 得 | ca] 和 1cgr| 的 极 大 元 素 攻 在 区 间 (十, 1) 


中 ,这 样 做 不 产生 会 人 误差。 如 果 用 浮 点 计算 ,这 些 规范 化 因子 好 
像 没有 意义 , 但 是 要 找到 所 得 的 三 对 角 和 矩阵 (第 五 章 $67) 的 特征 
向 量 时 ,它们 就 显得 重要 ， 

我 们 知道 , 在 任何 阶段 ， 如 果 cfe*# 一 0, 那么 在 理论 上 过 程 
将 要 中 断 , 因 此 我 们 不 妨 设 想 如 果 cfe# 中 , 数值 过 程 是 不 稳定 的 。 
(我 们 这 里 假定 c; 和 < 是 规范 化 的 ,) 如 果 所 有 的 cjeX 的 数量 级 
都 是 1 ,那么 我 们 可 以 证 明 对 于 规范 化 的 矩阵 4, (35,5) 产生 


AC ~ CT + 0(27), (38.4) 
其 中 了 是 三 对 角 和 矩阵 ,其 元 素 是 
ti 0 fant = pins fit Tine (38.5) 


人们 也 许 认为 。 我 们 应 该 用 (T 十 F) 代替 了 ， 这 里 了 是 由 
5 形成 的 矩阵 , (了 十 F) 是 上 Hessenberg 型 ， 在 它 的 三 对 角 线 
以 外 都 是 小 元 素 。 这 祥 做 毫 无 意义 ,因为 了 的 贡献 已 经 被 0(2-7) 
项 包括 了 。0(2”') 的 精确 的 界 依赖 于 使 用 的 运算 类 型 。 
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然而 ,如 果 对 某 个 有 

df we 2 《(P 是 正 整数 )， (38.6) 
我 们 发 现 ,通常 有 

AC = CT + 0(227). (38.7) 
因此 ,和 4 的 稳定 变换 相 比 ,一 般 妆 损失 精度 2p 位 以 上 。 


数值 例子 


39. 表 5 的 例子 很 好 地 说 明了 不 稳定 的 本 质 , 为 简单 起 见 ,在 
例子 中 我 们 取 c; 和 注 几乎 正 交 ( 实 际 上 , 取 cr 一 性 能 避免 第 一 
步 发 生 中 断 ). 应 用 高 精度 执行 了 计算 。 因 此 给 出 的 值 全 部 数字 都 
是 正确 的 。 为 了 说 明 我 们 的 观点 ， 我 们 取 了 和 7 都 是 1， 涩 
此 ,Bi 和 全 相等 。 

注意 ,如 果 我 们 用 s 表示 <jey, 那么 四 和 四 都 是 es 数量 级 
并 且 几 乎 相等 ,但 是 符号 相反 ,而 有 是。 数量 级 。 通 过 相当 宛 长 
的 分 析 可 以 证 明 ,一 般 情况 下 ,如 果 czcz 一 s,， 那么 w 和 ou 是 
14l/s 数量 级 Bers 是 ‖4IP/ee 数量 级 ，Prs+ 是 |4llPs 数量 级 
( 表 5 的 例 中 ， 我 们 e 的 值 楼 取得 远 小 于 2 ， 最 后 的 结果 才 会 变 
得 明显 )、 小 的 “7c<* 引 起 一 阵 急剧 的 变化 ,然后 又 平息 下 来 ， 除 


表 5 
TT 
4132 1 2 eTe¥ = 2 

2125 2 下 
1 334 0 0 
4121 0 0 
1026.5005 一 1037297.7 
"| 1 一 1010.5982 一 1,1047112 
1 一 8.7263879 1.0358765 
1 1.6241315 
1026.5005 一 1037。2977 
-| 1000 一 1010,3982 一 1.1047112 
1 一 8.7263879 1.0358765 
1 1.6241313 
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和 后 来 又 遇 到 小 的 cfc#。 但 是 ,如 果 又 发 生 小 “jey, 这 是 独立 的 
事件 ， 
现在 我 们 可 以 立刻 奢 出 , 为 什么 2 量 级 的 c?c* 值 具有 方 
程 (38.7) 指 明 的 效果 。 例 如 , 我 们 只 考虑 二 阶 拭 阵 , 并 且 得 到 m。 
呈 和 所 的 正确 地 合 人 的 值 ， 于 是 计算 的 矩阵 可 表 孙 为 
[* +8) Pl + 5) 
1 ol 二 es)l” 
其 中 和 所 是 对 应 准确 计算 的 值 。 在 (39.1) 中 的 矩阵 的 特征 多 
项 式 是 
BP—Aall +e) to(lt 6)] +am(l + e)(l + 8s:) 


lal S27 (39.1) 


— Pll 十 ez)。 (39.2) 
因此 ,在 常数 项 中 的 误差 是 
qal 61 + 6 十 B163) — Pr. (39.3) 


我 们 已 经 君 出 ,om 和 是 2? 阶 , 名 是 2* 阶 . 没有 理由 认为 在 
(39.3) 中 会 发 生 两 项 相 消 。 一般, 它们 不 相约 ,在 这 个 例子 中 附带 
说 明了 在 以 前 各 步 误差 的 放大 不 会 产生 什么 困难 . 

在 表 5 的 例 中 ,如 果 我 们 用 通常 的 比例 因子 ， 得 到 矩阵 全 而 
不 是 了 , 但 是 我 们 的 论证 并 不 因此 而 改变 ,这 “损失 ”仍然 与 2* 而 
不 是 与 2 成 比例 。 

用 双 精 度 (60 位 二 进位 ) 的 Lanczos 方法 和 不 同 的 ? 值 的 初 
始 向 量 


ct=(1, 2 0, 0), (er)T = (277, 1,0, 0) 

解 同一 个 矩阵 的 问题 随 着 的 增加 ,计算 的 工 的 特征 值 与 4 的 信 
离 愈 来 愈 大 ,到 z 一 30 时 , 它们 没有 相同 的 数字 。 由 此 确认 我 们 
的 分 析 是 正确 的 , 量 m%, mm P,, 名 的 数量 级 的 变化 情况 与 本 节 指 
出 的 一 致 。 


非 对 称 的 Lanczos 方法 的 总 评述 


40. 虽然 Lanczos 方法 已 提供 我 们 一 个 三 对 角 短 阵 , 原 数据 被 
压缩 到 令 人 十 分 满意 的 程度 ， 但 是 我 们 要 用 数值 稳定 性 付出 巨大 
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的 代价 ， 因 为 Lanczos 方法 的 潜在 的 不 稳定 性 , 我 们 已 经 用 双 精 
度 运算 编制 Lanczas 方法 的 程序 ， 并 且 对 于 规范 化 的 c; 和 co? 设 
置 了 关 值 ,用 它 来 判定 1cfe?| 的 量 是 否 可 以 接受 。 如果 这 个 内 积 
的 模 小 于 2 那么 就 用 不 同 的 初始 向 量 重新 开始 作 。 虽然 重新 
开始 作 的 情况 很 少 发 生 ， 但 是 “fcy 的 值 是 适中 的 小 却 是 很 平常 
的 ,这 表明 希望 计算 结果 准确 ,用 单 精度 运算 是 不 够 的 . 

假如 算法 中 包括 重新 正 交 化 , 总 的 乘法 量 约 是 4, 同时 由 于 
始终 用 双 精 度 计算 , 运算 量 是 很 大 的 。 注意 到 原 矩 阵 不 必用 双 精 
度 表 示 , 因 此 形成 4c; 和 4zcy (包含 2 次 乘法 ) 时 ,我 们 仅仅 需 
时 4 的 单 精度 元 素 与 c; 和 c? 双 精度 元 素 相 委 ， 在 8$49 中 我 们 要 
说 明 有 另外 的 方法 ,关于 稳定 性 方面 ， 它 与 Lanczos 方法 等 价 , 但 
这 方法 需要 的 工作 量 少 得 多 。 因此 , 我 们 不 再 进一步 讨论 非 对 称 
的 Lanczos 方法 . 


对 称 的 Lanczos 方法 


44. 当 4 是 实 对 称 矩 阵 时 ,我 们 取 c, 一 池 。 于 是 两 个 向 量 序 
列 相同 。 另外, 如 果 在 每 一 阶段 我 们 选择 >-+ 使 得 |lcrr 由 一 1， 
我 们 可 以 看 出 对 称 的 Lanczos 方法 和 对 称 的 Arnoldi 方法 相同 
对 称 的 和 非 对 称 的 Lanczos 方法 ,再 正 交 化 都 疝 样 重要 ,但 是 对 称 
的 方法 只 需要 一 半 的 计算 量 。 然而 , 如 同 我 们 对 于 Arnoldi 方法 
所 指出 的 。 通 常 不 会 有 cfc} 一 0， 因 为 我 们 从 规范 化 有 cfez 一 
lall=1. 

如 果 我 们 把 再 正 交 化 包括 进来 ,对 称 的 Lanezos 方法 的 数值 稳 
定性 和 对 称 的 Givens 方法 或 Householder 方法 一 样 好 ， 但 是 
Householder 方法 运算 量 节 省 得 多 。 如 果 初 始 向 量 完全 欠缺 或 几 
平 完 全 欠缺 基 些 特征 向 量 的 成 分 ,也 不 影响 精确 度 ,但 是 这 种 情况 
下 再 正 交 化 特别 重要 。 如 果 我 们 取 一 。,， 那 么 如 果 用 准确 的 
计算 ，Lanczos 方法 给 出 的 三 对 角 甜 阵 与 Givens 和 Householder 
方法 给 出 的 除了 符号 之 外 完全 相同 。 难以 想像 有 什么 理由 说 明 ， 
应 该 优先 采用 Lanczos 方法 ,而 不 是 Householder 方法 。 
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马 


配 


我 们 假定 在 每 一 阶段 选取 规范 化 因子 x, 使 lc 一 1， 这 使 

得 这 个 方法 与 别 的 方法 特别 紧密 相关 。 可 是 它 没 有 其 他 用 处 并 且 

必须 用 平方 根 。 实 际 上 ,比较 简单 的 办 法 是 选取 7, 为 2 的 宕 使 得 

er| 的 最 大 元 素 落 在 到 和 1 之 间 。 对 于 准确 的 计算 ， 所 有 的 名 

是 非 负 的 ,因为 从 (35.12) 有 

Br Tee ecs we 四 /中 (41.1) 

可 是 fp, 不 是 这 样 计算 的 ,因此 计算 的 2. 可 能 是 个 小 的 负数 .在 这 

种 情况 下 。Z 不 是 拟 对 称 的 《第 五 章 566)。 在 计算 的 特征 信和 时 
应 该 用 零 代替 这 样 的 8,。 


化 Hessenberg 矩阵 为 更 压缩 的 形式 


42. 我 们 已 经 看 到 ,有 许多 十 分 稳定 的 方法 把 一 般 矩 阵 约 化 
为 Hessenberg 型 。 本 章 的 余下 部 分 叙述 有 关 日 essenberg 和 矩阵 进 
一 步 约 化 为 某 种 更 压缩 的 形式 .我 们 将 讨论 两 种 这 样 的 形式 , 即 三 
对 角 型 和 Frobenius 型 . 我们 已 提 过 非 对 称 Lanczos 方法 产生 三 
对 和 角 型 矩阵 ,但 是 要 冒 数值 不 稳定 的 风险 ,我 们 会 发 现 , 对 本 章 余 
下 部 分 要 讨论 的 所 有 方法 ,一 般 来 说 都 是 如 此 。 


化 下 Hessenberg 矩阵 为 三 对 角 型 


43, 首先 让 我 们 研究 $11 的 方法 应 用 于 一 个 下 Hessenberg 型 
矩阵 4， 现 在 ,我 们 不 考虑 交换 问题 , 因此 , 我 们 要 求 单 位 下 三 角 
矩阵 NN, 其 第 一 列 是 ci。 使 得 

AN = NH, (43.1) 
其 中 在 是 上 昌 essenberg 型 。 我 们 证 明 ， 在 这 种 情况 下 五 必定 是 
三 对 角 型 .我 们 仅 需 证 明 br 一 0 (r > i 十 1), 因为 已 知 电 是 上 
Hesscnberg 型 。 

逐次 对 (43.1) 两 边 第 * 列 的 元 素 列 等 式 . 由 于 4 是 下 Hessen- 
berg 型 ，N 是 下 三 角 型 ,因此 当 < 一 1 时 , AN 的 (i, +) 元 
案 都 是 零 , 因 此 我 们 依次 有 


“dlle 


0 一 加 
0 = hs 
0 = nh + hs, = hs (43.2) 
0 一 major + nbs + hs = hiss 
0 = #0 ah -pr asp 十 TF hrs = rae 
至 此 ,证 明 完 毕 。 
上 述 证 明 中 , 入 的 第 一 列 是 ec 不 是 本 质 的 。 如 有 果 我 们 指定 
的 第 一 列 是 第 一 个 元 素 为 1 的 任何 商量 , 那么 在 (43.2) 中 除了 第 
一 个 方程 外 我 们 仅 引 人 一 项 nh。 整个 NN 和 互补 确定 了 ,五 仍然 
是 三 对 有 角 型 。 
对 于 五 的 第 * 列 的 非 稚 元 素 , 我 们 有 
Gr heley 
i 一 Bror- 才 -hr 十 和 
raw 十 GzHortiBr+lr 十 Go+brtigrtar = Neri be > 
十 zsbrhm 十 和 rtrs 


(43.3) 
而 对 于 NN 的 第 (r 十 1) 列 的 非 零 元 素 , 我 们 有 
Gir 十 ertilietir 十 irritrtsr 二 + a 
EC 
(43.4) 


如 果 某 一 个 下 标 大 于 ， 那 么 对 应 的 项 被 格 去 。 内 积 可 以 象 $11 
那样 累加 。 但 是 因为 4, H 有 特殊 形式 使 关系 式 简化 了 。 在 全 过 


程 中 约 有 二 呈 次 乘法 。 


使 用 交换 


44. 我 们 用 $11 的 而 不 是 88 的 思想 来 叙述 了 这 个 方法 , 因为 
前 者 的 会 人 误差 方面 比较 理想 。 对 于 讨论 交换 问题 加 到 $8 的 令 
述 方法 更 方便 一 些 。 当 4。 是 下 Hesenberg 型 时 ， 如 果 没 有 交 
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换 ， 41 的 形式 用 n 一 6，* 一 3 为 例 表明 如下。 
xx 


x 

xXxXx “ 
xx x 

0 x X X xXx 

第 + 步 如 下 ,对 于 i 从 ”十 2 到 ”执行 (iD) 和 (i: 

(GD 计算 mrr 一 arfarrar 

(i) 第 i 行 碱 去 we X 第 ?十 1 行 (注意 第 7 十 1 行 除 
artlhr 外 只 有 两 个 非 零 元 素 )。 

(省) 对 于 i 从 +f 十 2 到 #， 把 we X 第 : 列 加 到 第 > 十 1 
列 上 , “ 

显然 ,第 ” 步 不 破坏 4e 原 有 的 零 元 素 以 及 以 前 各 步 引 人 的 零 
元 素 , 

可 是 ， 如 果 arar 一 0 并 且 对 某 个 i，ai 过 0， 这 个 过 程 在 
第 r 步 就 中 断 。 通 常 我 们 通过 交换 来 避免 这 类 中 断 , 但 是 如 果 我 
们 按 通常 的 方式 交换 第 * 十 1 行 与 第 (7 十 1)’ 行 ,第 ?十 1 列 与 
第 (> 十 1) 列 ， 那么 将 琉球 对 角 线 以 上 的 办 元 素 结构 交换 与 名 
在 开始 化 三 对 角 型 之 前 用 以 型 的 矩阵 执行 一 个 相似 变换 如 果 
出 现 中 断 ， 我 们 可 以 重新 开始 ， 希 望 应 用 这 样 的 变换 之 后 不 再 发 
生 中 断 。 在 551 我 们 指明 , 怎样 能 够 稍为 改善 这 种 相当 杂乱 的 过 
程 ， 

区 为 不 允许 交换 , 如 果 我 们 希望 得 到 三 对 角 矩 阵 , 就 有 数值 不 
稳定 的 明显 的 危险 .如果 在 任 一 阶段 ，lerrv| 比 各 个 lo (i 一 
7 十 2,'…，z) 小 得 多 ,那么 对 应 的 [miral 将 比 1 大 得 多 。 

容易 看 出 ， 使 用 平面 旋转 或 初等 Hermite 符 阵 也 破坏 下 
Hessenberg 型 的 结构 。 因此， 不 存在 和 我 们 已 描述 的 使 用 正 交 和 矩 
阵 的 方法 类 似 的 简单 方法 。 一 般 来 说 ,我 们 发 现 , 当 用 初等 矩阵 技 
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(44.1) 


cocox X 


oooox 
xIxxxx 


术 时 不 允许 作 "稳定 化 "就 不 存 存 相应 的 正 交 矩 阵 技 术 。 


小 主 元 素 的 彩 响 

45. 我 们 现在 详细 地 研究 第 步 开 始 时 出 现 小 主 元 素 of 
的 影响 。 为 方便 想见, 我们 用 。 表示 这 个 元 素 , 用 *, ,zt 分 别 
表示 有 关 的 第 +，r 十 1, + 十 2 列 的 元 素 , 当 # 一 7,+ 一 3 时 
有 关 的 矩阵 是 


B a . (45.1) 
ry ¥ 33 X 
x Ye zs X X 
Ow zs Xx 
对 于 第 7 个 变换 只 有 这 些 列 被 改变 ， 考 虑 已 修改 的 元 素 的 渐 近 性 
质 ,我 们 有 


rm sragrtfa + O (1) 


er xs/ + 0 (tL) Gr +t2, 0), 


oooooxx 
oxxx 
x 
x 


a rm + 0 (1) Gr +t 2, 
(45.2) 
注意 ， 新 的 第 (r 十 1) 列 和 第 (r 十 2) 列 的 对 应 元 素 大 致 成 
定 的 比例 。 通 常 下 一 步 的 乘 数 给 定 为 
二 OE), (45.3) 
因此 它 是 1 数量 级 的 ， 当 用 Nt 左 姜 4 时 ,第 (r 十 2) 列 的 
第 i 个 元 素 变 为 
一 ee rp 一 starrtfs + OC1) — [xifrrrs + Oe)] 
X [一 rasrrxyfe 十 OCT 
一 0(D。 (45.4) 
这 个 篇 单 的 分 析 低 估 了 用 夭 阵 N.。 作 相似 变换 产生 的 相约 的 严 
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重 性 。 更 精密 的 分 析 证 明 

on 一 0(s)。 (45.5) 
可 是 ， 矩 阵 N,t， 是 绝 不 例外 的 《除非 独立 的 另 一 个 不 稳定 性 发 
生 ), 则 时 不 稳定 性 消失 掉 。 在 最 后 的 三 对 角 和 矩阵 中 , 它 的 主要 影 
响 是 在 第 (r 十 1D), (r 十 2), (7 十 3) 行 , 其 中 元 素 的 数量 级 是 : 
第 (r 十 1) 行 ed4fe 8B 


第 (r 十 2) 行 Cje: 一 Aje D (45.6) 
第 (r 十 3) 行 Es 了 G 
这 里 4 下,… 是 ji4j 的 数量 级 的 ,并 且 
尾 s 一 BC。 (45.7) 


注意 ,在 最 后 的 矩阵 里 特殊 元 带 的 分 布 是 在 Lanczos 方法 中 
当 coree?ny 一 时 我 们 观察 到 的 分 布 的 反 影 。 在 $48 中 我 们 将 
说 明 为 什么 会 有 这 个 紧密 的 关系 存在 . 

误 禁 分 析 

46. Wilkinson (19624) 已 经 给 出 关于 约 化 矩阵 为 三 对 角 型 的 
十 分 详细 的 误差 分 析 , 我 们 在 这 里 只 介绍 已 取得 的 结果 。 在 这 些 
分 析 中 存在 一 个 小 困难 。 在 $14 我们 已 经 看 四, 即使 对 一 般 和 矩阵 
约 化 为 Hessenberg 型 ,如 果 人 允许 交换 要 无 条 件 地 保证 稳定 性 是 不 
可 能 的 。 从 上 Hessenberg 型 化 为 三 对 角 型 的 约 化 中 ,即使 在 所 有 
的 索 子 磁 巧 都 是 1 的 数量 级 的 有 利 的 情况 下 也 会 发 生 同 样 的 问 
题 .显然 ,这 不 是 现在 争论 的 问题 ,现在 我 们 关心 的 是 ,与 大 乘 子 联 
系 在 一 起 的 小 主 元 素 导 致 的 特有 的 误差 。 在 Wilkinson(1962a) 的 
分 析 中 , 忽略 了 和 任何 放大 的 影响 , 这 种 影响 可 能 来 自用 一 系列 N。 
和 Nm 带 正常 使 人 误差 的 右 乘 , 其 中 N,, Nz: 的 元 素 都 是 1 的 数 
量 级 。 在 这 种 情况 下 有 下 述 结果 . 

当 有 一 个 不 稳定 的 阶段 , 产生 了 一 个 2 数量 级 的 乘 子 , 那么 
在 原 矩 阵 4 的 某 些 元 素 上 的 等 价 摄 动 是 24“ 数量 级 的 。 一 般 而 
言 , 这 导致 特征 值 的 摄 动 也 是 2* 的 数量 级 。 如 果 我 们 希望 得 到 
的 结果 与 没有 不 稳定 阶段 的 约 化 所 得 的 结果 相当 ， 那 么 我 们 必须 
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用 + 十 24 位 而 不 是 + 位 作 运算 。 向 后 分 析 证 明 , 只 是 有 限 部 分 
计算 必须 用 这 些 额外 的 位 数 ， 可 是 在 自动 计算 机 上 想 利用 这 个 特 
点 取得 好 处 是 很 不 方便 的 ， 这 也 十 分 清楚 地 说 明了 在 不 稳定 除 有 区 
之 前 已 有 的 误差 影响 不 会 被 大 张 子 放大。 


以 = 一 6, 在 第 二 阶段 有 不 稳 性 的 情况 为 例 ,最 后 得 到 的 三 对 
角 和 矩阵 工 的 元 素 的 量 级 是 


171 一 。 (46.1) 


1 1 
对 应 于 4 的 良 态 的 特征 值 ,的 左 、 右 特征 向 量 x*,y 的 元 素 的 数 
量 级 分 别 是 
(1, 1, 24 1, 1, 1,) (46.2) 

和 

(1, 1, 1, 2*, 1, 1), (46.3) 
中 向 量 被 规范 化 为 yzx 是 1 的 量 级 ， 对 应 的 条 件数 是 2# 量 级 
因此 问题 已 发 生 严重 恶化 ， 可 是 ,这 只 是 一 个 假象 ,因为 工 是 没有 
平衡 好 的 。 我 们 可 以 用 对 角 相似 变换 把 它 变换 成 矩阵 名 其 元 素 
的 量 级 为 


1 1 | 


~ 2 24 2 
[| = 24 2 2 
2 
1 11 
_ 1 1 
为 了 避免 伟人 误差 ,对 角 矩 阵 的 元 素 可 用 2 的 宕 .对 应 的 y 和 * 仍 
然 使 rz 是 1 量 级 的 ,那么 其 分 量 的 嚼 级 分 别 是 
(1, 1, 2*, 24, 1, 1) (46.5) 


《46.4) 
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和 

{1,1,1, 1, 1, 1), (46.6) 
现在 条 件数 是 2: 数量 级 。 尽管 如 此 ， 为 计算 了 或 他 的 特征 值 ， 
人 们 一 般 必须 比 对 没有 不 稳定 阶段 的 过 程 得 到 的 三 对 第 和 矩阵 多 用 
2 位 作 计算 ， 

这 些 结果 表明 ,如 果 我 们 准备 用 双 精 度 运算 , 那么 下 述 两 个 方 
法 之 一 可 以 采用 . 

(D 我 们 可 以 接受 数量 级 高 至 2" 的 箭 子 。， 如 果 没 有 发 生 多 
次 不 稳定 ( 见 Wilkinson，1962a) ， 这 个 误差 等 价 于 在 4 上 不 大 于 
2 x (2#)2 即 2 的 摄 动 ， 如 果 乘 子 超过 这 个 限 值 ， 我 们 就 
到 矩阵 4， 用 某 个 矩阵 N, 执行 初始 的 相似 变换 然后 重复 这 约 化 
过 程 ， 

(ii) 如 果 我 们 不 转 回 开始 阶段 重 作 , 那 么 我 们 必须 用 2 代 
替 所 有 小 于 2-* 的 主 元 素 。 这 样 的 代替 产生 的 误差 是 这 27 
数量 级 的 本 身 ,而 从 以 后 的 约 化 过 程 中 产生 的 误差 是 2-X (2 
的 数量 级 , 即 2 量 级 .所 以 ,这 是 最 优 的 选择 。 值 得 注意 的 是 ， 
如 果 我 们 准备 用 三 倍 位 精度 运算 , 对 应 的 限 值 是 2…, 而 4 的 等 价 
摄 动 的 数量 级 不 大 于 2 一 


I 


加 


应 用 于 下 Hessenberg 型 的 Hessenberg 方法 


47. 在 $30 中 我 们 指出 ， 如 果 取 $26 的 里 一 了 ，Hessenberg 
方法 和 不 交换 的 直接 约 化 方法 相同 , 甚至 连 舍 人 误差 都 一 样 。 因 
为 在 一 般 情 况 下 ,这 是 正确 的 , 因此 对 于 特殊 情况 , 初始 矩阵 是 下 
Hessenberg 型 时 结论 也 是 正确 的 ， 我 们 尽管 有 这 种 关系 ,用 Hes 
senberg 方法 再 次 描述 约 化 过 程 是 有 好 处 的 。 

第 7 步 开始 时 ,我 们 已 计算 了 co <，……，cr ci 的 前 (i 一 1) 
个 主 元 素 是 零 ,第 i 个 元 素 是 1。 第 7 步 用 下 述 关 系 计算 cr 

Roticrts = Acr — bic — hcs — 7 — hers (47.1) 
我 们 选 定 加 使 得 cr 与 n，… ,et 正 交 ， 既然 4 是 下 Hessenberg 
型 ,因此 4c, 的 前 (+ 一 2) 个 元 素 是 零 。 它 已 经 和 4,……, 6-， 
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正 交 ,因此 有 加 一 0 (i 一 1,-…,r 一 2)， 若 不 考虑 因子 p45 cmts 
是 由 4c, 减 去 har 权 cr 及 入 乘 “得 出 ,因而 使 第 (r 一 了 
和 第 ”个 元 素 化 为 零 . 我 们 选取 因子 如 + 使 “+ 的 第 + 十 1 元 
素 为 1. 显然 ,矩阵 互 是 三 对 角 型 。 当 《47.1) 右边 的 向 量 不 是 零 ， 
但 是 第 > 十 1 个 元 素 是 老 , 过 程 就 中 断 ， 如 果 整 个 向 量 是 零 ，c+s 
可 以 取 成 第 7 十 工 个 元 素 等 于 1， 并且 与 eu e,,*……, ec, 正 交 的 任 
何 向 量 ， 

如 果 c: 一 co 向 量 与 $5543, 44 的 矩阵 六 的 列 恒 等 。 根据 
$44， 取 ci 为 第 一 分 量 是 1 的 任何 其 他 向 量 是 等 价 于 多 加 一 个 初 
始 变 换 N,ANT', 其 中 NT! 的 第 1 列 是 cu 


Hessenberg 方法 与 Lanczos 方法 的 关系 


48. 现在 我 们 进一步 证 明 , 当 4 是 下 Hessenberg 型 时 , Hessen- 
berg 方法 与 Lanczos 方法 有 着 密切 的 关系 . 

我 们 首先 证 明 , 如 果 在 Lanczos 方法 中 我 们 取 c 一 co 那么 
向 量 c# 形成 一 个 上 三 角形 矩阵 的 列 ， 并 且 这 与 c, 的 选择 无 关 ， 
假定 这 个 结论 直到 <* 是 正确 的 ,我 们 有 

cy 一 LT 一 《48.1) 
因为 人 是 上 Hessenberg 型 ,从 我 们 对 co? 的 归纳 法 假定 , ATc; 的 
第 7 十 2,-…, 7 个 分 量 是 零 . 因此 ， 无 论 a 与 B+ 取 什么 样 的 
值 ,在 向 量 e+， 的 这 些 位 置 上 所 有 元 素 都 是 老 , 这 正 是 我 们 要 证 
明 的 结论 . 

我 们 可 以 用 这 个 结果 证 明 向 量 。 是 下 三 角形 矩阵 的 列 . 根 
据 $34, 对 任何 上 三 角形 矩阵 的 列 作 正 交 化 和 对 了 的 列 作 正 交 化 
产生 一 样 的 结果 ， 并 且 正 交 化 并 不 需要 用 到 这 个 上 三 角形 矩阵 的 
元 素 . 

因为 用 XX 一 了 代替 X 一 C* 得 到 的 结果 相同 ,因此 Lanczos 
方法 不 必 计 算 c} 就 能 得 到 向 景 ct 和 mw， Bt。 现在 我 们 已 建立 了 
Lanczos 向 量 与 Hessenberg 向 量 的 重 等 性 在 这 种 特殊 情况 下 
Lanczos 方法 不 需要 再 正 交 化 , 因为 当 X 是 上 三 角 型 时 , 准确 的 正 
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交 性 是 白 然 地 达到 的 , 如 果 进 一 步 有 <, = es 那么 Hessenberg 方 
法 和 Lanczos 方法 给 出 的 结果 与 543 的 方法 给 出 的 相同 

现在 我 们 看 到 ,$43 的 过 程 中 出 现 小 主 元 素 导致 三 对 角 短 阵 
具有 和 839 的 Lanczos 过 程 中 出 现 小 的 cje* 时 ， 相 同 的 性 态 是 
毫 不 奇怪 的 。 前 者 只 不 过 是 Lanczos 方法 的 普遍 现象 的 一 个 特殊 
情况 。 


化 一 般 失 阵 为 三 对 角 型 


49. $12 和 $43 的 方法 可 以 结合 起 来 得 到 一 个 约 化 一 般 矩 降 

4 为 三 对 角 型 的 方法 .我 们 首先 用 $12 的 有 交换 的 方法 化 4 为 上 

Hessenberg 矩阵 如 。 除 了 非常 特殊 的 情况 之 外 ,这 是 稳定 的 过 程 

并 且 我 们 可 以 用 单 精度 运算 .因为 正定 下 Hessenberg 型 的 , 现 

在 我 们 可 以 用 $43 的 方法 (或 $47 的 等 价 的 方法 ) 得 到 三 对 角 矩 隆 
了, 使 得 

HIN ~ NT 或 NIH TIN, (49.1) 

因此 , 矩阵 7?, 也 是 三 对 角 型 ， 是 与 4 相似 的 。 第 二 个 变换 的 多 

定性 显然 是 差 的， 我 们 应 该 用 双 精 度 运算 并且 采取 $46 叙述 的 预 


防 措施 。 总 之 ， 化 矩阵 为 三 对 角 型 需要 Eo 次 单 精度 乘法 和 
a 次 双 精度 乘法 . 


我 们 用 了 HT? 描述 方法 的 第 二 部 分 ,原因 是 十 分 明显 的 , 但 是 
因为 NT 一 M 是 单位 上 三 角形 矩阵 ， 它 的 第 一 行 等 于 ef。 用 类 
似 于 $43 的 方法 ,其 中 行 和 列 的 作用 对 调 , 我 们 可 以 直接 对 M , 
求解 矩阵 方程 

MH= T™. (49.2) 

我 们 已 尽力 着 重 指出 化 矩阵 为 三 对 角 型 有 潜在 的 不 稳定 竹 ， 
但 是 我 们 不 希望 过 分 背 失 信心 。 例如 , 在 ACE 上 乘 子 接近 限 值 
2 (4 一 48) 的 情况 是 极其 罕见 的 。 当 用 双 精 度 进行 互 的 约 化 
时 ， 这 部 分 的 误差 几乎 总 是 远 远 小 于 用 单 精度 约 化 4 为 如 时 产生 
的 误差 。 上 述 的 组 合 方法 在 实际 计算 中 是 十 分 有 效 的 。 


49. 


和 Lanezos 方法 比较 


如. 现在 ，535 的 Lanczos 方法 能 使 一 般 和 矩阵 4 直接 化 为 三 
对 角 和 矩阵 。 可 是 这 个 方法 必须 计算 c; 和 cy 两 个 序列 ， 并 且 再 正 
交 化 是 非 做 不 可 的 。 在 过 程 的 每 一 阶段 都 会 出 现 不 稳定 性 的 危 
险 ,因此 作为 安全 措施 , 在 变换 全 程 都 使 用 双 精 度 运算 , 总 的 乘法 
基 是 42"， 如 果 在 某 阶 段 cfc} 的 值 过 分 小 , 我 们 必须 转 到 开头 重 
作 并 且 还 有 再 失败 的 可 能 ，549 的 组 合 方法 至 多 只 要 男 到 百 ， 实 
际 上 ,用 $49 的 组 合 技术 比 Lanczos 方法 要 好 得 多 。 至 于 前 者 的 
所 有 不 稳定 性 ， 人 恰恰 就 是 使 用 非 对 称 的 Lanczos 方法 引起 的 不 稳 
定 福 . 


化 矩阵 为 三 对 角 型 的 重新 考察 


51. 在 $44 我 们 指出 , 如 果 约 化 下 Hessenberg 型 为 三 对 角 型 
的 第 > 步 发 生 中 断 , 我 们 必须 重新 开始 ,并 抱 着 不 再 发 生 中 断 的 希 
望 ,对 某 N, 计算 NANT'， 如 果 我 们 考虑 Hessenberg 方法 , 我们 
可 以 得 到 关于 选择 N, 亦 即 选择 ci 的 某 些 指 示 . 

注意 , 的 前 (2+ 十 1) 个 元 素 唯 一 地 确定 “; 的 第 1，…， 
2+ 十 2 一 i 个 元 素 (i 一 1,……,r 十 1). 我 们 用 + = 3 的 情况 来 说 明 ， 

cr er ec 
X000 
XXX 0 0 
XXX 0 


Xxxx (S11) 
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我 们 可 以 这 样 进行 下 去 , 先 取 “: 的 第 一 个 元 素 为 1, 然后 每 次 给 它 
后 面 的 两 个 元 素 赋值 ， 如 (51.1) 所 示 , 每 当 添加 两 个 额外 的 元 罕 ， 
我 们 就 可 以 计算 尽 可 能 多 的 cy 的 元 素 . 当 计算 cri 的 第 * 十 1 
个 元 素 时 , 如 果 出 现 严 重 的 相约 , 我 们 就 改变 “: 的 最 后 两 个 元 素 ， 
因而 每 个 ci (i 一 1 .…r 十 1) 的 最 后 两 个 元 素 也 相应 改变 ， 这 
样 作 可 以 带 免 全 部 重 作 ， 但 是 这 个 办 法 不 能 处 理发 生 于 ci 之 后 
的 中 断 。 这 个 方法 还 有 一 个 弱点 , cr+: 的 全 部 元 素 由 于 发 生 相 
约 可 能 都 是 小 的 。 如 果 这 种 情况 真 的 发 生 , 计算 工作 不 需要 重新 
作 , 但 是 很 可 异 , 在 计算 “rtx 的 第 * 十 工 个 元 素 的 那 一 步 ， 我 们 不 
知道 它 以 后 的 任何 元 素 ， 

鉴于 这 些 缺 点 ， 我 们 必须 把 这 些 结果 只 作为 深信 了 解 影响 选 
择 “的 因素 ,而 不 是 作为 形成 实际 方法 的 基础 。 


化 上 Hessenberg 型 为 Frobenius 型 


52, 最 后 我 们 考虑 化 上 Hessenberg 型 矩阵 妃 为 Frobenios 型 
(第 一 章 $11~ $14)。 我 们 用 各.， 表示 下 次 对 角 线 元 素 二 :or 并 
假定 总 天 0 (i 一 2。… 2)。 事 实 上 ， 如 果 ti 一 0, 我们 可 以 
写 召 为 


万 一 [有 B, |， (52.1) 
© He 


其 中 H. 和 日 ,-, 是 上 Hessenberg 型 ,因此 ， 
det (H — 41) = det (H, — XT) det (Hr — +1). (52.2) 
如 果 右 关 0 (i 一 2,*…，n),，HH 不 可 能 是 减 次 的 ,因为 对 于 任何 
4 值 (8 一 41) 的 秩 至 少 是 (n 一 1); 另 一 方面 ,如 果 瑟 是 非 碱 次 
的 , 却 可 以 有 许多 右 是 零 . 在 后 一 种 情况 ,我 们 只 计算 较 小 的 Hes- 
senberg 子 和 矩阵 的 Frobenius 型 。 我 们 得 到 特征 多 项 式 的 因子 化 
形式 ,这 总 是 有 好 处 的 。 
首先 , 我 们 假定 如 除了 是 非 鹤 之 外 再 没有 其 他 特点 。 约 化 过 
程 由 (r 一 1) 步 组 成 , 当 n 一 6, + 一 4, 第 + 步 开 始 时 , 矩阵 的 形 
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状 是 


X|X X x 
XXX|X X X 
XXX XXX x 


> {52.3} 


各 


下 次 对 角 线 元 素 始 终 不 变 。 第 ” 步 的 计算 步骤 如 下 ; 

对 于 ; 从 工 到 > 执行 让, (ii): 

0) 计算 mrre 一 hf; 

(ii) 第 i 行 碱 去 mw Xx 第 (r 十 1) 行 ; 

(证 ) 对 于 从 1 到 7， 和 wniert 加 到 所 ,rr 上 ， 这 就 完成 了 
相似 变换 ， 

最 后 的 矩阵 和 和 它 的 对 角 相 似 变换 下 一 D"XD 给 定 为 


000...0 x 000.… 0 po 
下 0 0.… 0 x 100… 0 p 
一 | 0 0 x | Fo| 10£%0 pj, 
ha sn pe 
{52.4) 
其 中 马 的 元 素 是 
1, Kas Kakss “~, Kks Ray (52.5) 
而 所 给 定 为 
Pi = kariksti "Kort, (52.6) 


这 个 约 化 过 程 约 有 二 彤 次 乘法 。 


* 原 书 误 为 所 如 -ks-izi 一 译 者 六 
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小 主 元 素 的 影响 


8583， 如果 在 某 一 步 ，| fr| 比 ie| 小 得 多 , 乘 子 nr 就 很 
大 ,我 们 能 估计 到 有 不 稳定 性 ， 可 是 我 们 不 能 交换 行 、 列 , 否则 零 
元 素 的 分 布 会 被 破坏 。 因 此 不 存在 以 正 交 甜 阵 为 基础 的 变换 。 事 
实 上 ,我 们 通常 不 能 用 正 交 变换 得 到 Frobenius 标准 型 。 

可 以 看 出 ， 小 主 元 素 的 影响 比 化 矩阵 为 三 对 角 型 的 小 主 元 素 
影响 小 一 些 。 为 了 说 明 这 一 点 ,假定 第 + 步 的 + 是 s, 并 且 所 有 
其 它 元 素 的 量 级 都 是 1， 我 们 立刻 君 出 , 当 ” 一 5, r 一 3 了 时 ,这 一 
步 完成 之 后 ,有 关 元 案 的 量 级 是 

0 0 0 ate™ 
100 5 
1 0 ee |. (53.1) 
8 1 


素 也 没有 害处 。 如 时 我 们 对 (53.1) 的 矩阵 执行 下 一 步 ， 我 们 娩出 


最 后 矩阵 X 和 对 应 的 了 的 元 素 的 数量 级 是 
00 0 0 00001 
10008+ 10001 
X= 1 0 .08 |，F 一 100 1|, 
se 01 1 0 1 
11 1 1 
(53.2) 


王 中 所 有 8 数量 级 的 元 素 都 消失 了 ! 


数值 例子 

54. 上 韦 的 讨论 似乎 表明 小 主 元 素 无 害 ， 实 际 计算 的 Fro- 
benius 型 与 准确 计算 的 矩阵 没有 多 大 差别 ， 表 6 中 是 一 个 简单 的 
例子 
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表 8 


- [ee 10°%0.41325) ] 
10-《0.23125) 10:C0.10001) 
x=[ 0 一 10%(0.43245) = 人 wo on)] 
10- 民 9.231257 10K0.200003 110C0.20000) 


日 10 区 一 0.1000049…》 
下 而 的 ?一 [ 30K0.200005…) ] 


我 们 看 出 ,尽管 计算 x 用 的 缚 子 是 10 的 量 级 , 计算 的 了 确实 是 准 
确 到 运算 精度 ， 可 是 ,计算 的 了 的 特征 值 并 不 接近 准确 的 下 ,也 就 
是 及 的 特征 值 .产生 这 种 困难 的 原因 是 , 短 阵 的 演 态 比 玉 的 严重 
得 多 。 因此 ,的 元 素 中 小 的 误差 导致 特征 值 的 严重 失真 。 如 果 
我 们 注意 到 原 矩 阵 H 的 等 价 摄 动 就 会 立刻 揭露 出 变换 的 不 良 后 
果 。 事 实 上 , 如 果 立 是 计算 的 变换 ,我 们 可 以 验证 
10°(0.999948125) 19( 一 41756873725]] 

10™(0.23125) 10:(0.1000051875) 


NAXN 一 [ 


(54.1) 
(1;2) 元 素 有 一 个 很 大 的 振动 。 这 个 例子 的 名 一 各 作为 零 更 好 ， 
这 样 可 以 从 两 个 小 的 1X1 阶 再 sssenberg 矩阵 得 到 五 的 特征 值 ， 


关于 稳定 性 的 总 评述 


55. 在 约 化 成 Frobenius 标准 型 过 程 中 ,我 们 发 现 条 件数 严重 
变 坏 是 经 常 发 生 的 。 事 实 上 ,所 有 非 减 次 矩阵 只 要 特征 值 相同 ,不 
管 条 件数 是 什么 ,都 有 同样 的 Frobenius 标准 型 例如 , 考虑 第 五 
章 545 的 对 称 三 对 角 矩 阵 Wi。 因为 它 是 对 称 的 ， 并 且 它 的 百 征 
值 是 明显 分 离 的， 所 以 它 的 特征 信和 问题 、 特 征 向 量 问 题 都 是 祖 态 
的 。 尽管 如 此 ， 在 第 七 章 中 我 们 将 看 到 它 对 应 的 Frobenius 标准 
型 是 十 分 病态 的 . 

我 们 找 述 了 化 一 般 甜 阵 4 为 Frobenius 型 的 两 个 阶段 ， 

第 1 阶段 ; 用 稳定 的 初等 变换 化 4 为 上 Hesscnberg 型 到。 

第 2 阶 毁 : 用 不 稳定 的 初等 变换 化 妃 为 Frobenius 型 下， 
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这 两 个 阶段 中 涉及 的 稳定 性 的 考虑 是 很 不 相同 的 。 实际 上 ， 
在 第 二 阶段 我 们 一 般 必须 用 较 高 的 精度 运算 以 保证 这 阶段 产生 的 
误差 与 第 一 阶段 的 一 样 小 。 

在 Danilewski (1937) 的 方法 中 ， 这 两 个 阶段 是 结合 在 一 起 
的 ， 该 方法 有 (n 一 1) 步 ， 第 7 步 用 5,+ 型 的 矩阵 (第 一 章 $40 
《iv)) 作 相 似 变 换 使 第 + 列 的 第 1,… ，r，y 十 2，…，? 元 素 为 
堆 . 可 以 用 交换 保证 | (一 + 十 2,…, 9) 不 大 于 1, 但 
是 对 其 余 的 |%rt| 无 法 保证 ，Denilewski 方法 的 一 般 描述 没有 注 
意 到 方法 的 两 个 部 分 在 数值 稳定 性 方面 的 差别 。 


特殊 的 上 Hessenberg 型 


56. 如 果 原 来 的 Hessenberg 型 的 太一 1 人 一 2， 0)， 
$ 51 的 化 矩阵 为 Frobenius 型 的 过 程 都 大 为 简单 . 此 时 ,在 约 化 过 
程 中 不 需要 作 除 法 ,并 且 和 矩阵 区 就 是 所 求 的 型 F. 

如 果 Hessenberg 型 鼠 是 从 一 般 和 矩阵 4 导出 来 的 ,又 所 接着 化 
为 Frobenius 型 ,那么 最 好 把 已 的 下 次 对 角 线 元 素 , 除了 必定 是 堆 
的 以 外 ,都 化 成 1 这 是 能 够 做 到 和 的。 只 需 在 $29 的 Hessenberg 过 
程 中 取 总 + 为 1; 当 5rsri 为 零 时 则 是 例外 ,此 时 我 们 必须 取 + 为 
EE 

类 似 地 ,， 如果 我 们 拟 用 $11 的 方法 来 讨论 。 我 们 就 从 短 阵 方 
程 


AN=NH (56.1) 
求解 万 入 , 但 现在 是 在 尺 是 下 三 角 型 (6, 是 它 的 第 一 列 ) 而 不 是 
单位 下 三 角 型 及 互 的 下 次 对 角 线 元 案 是 1 的 条 件 下 求解 的 ， 像 在 
511 的 情况 一 样 ，N, 互 的 元 素 可 以 逐 列 求 得 , 现在 每 一 个 N 的 元 
素 以 一 个 内 积 形式 给 出 , 每 个 五 的 元 素 是 如 ,不 是 和 + 而 是 由 
一 个 内 积 除 以 wa 得 到 的 ,这 与 $11 的 情况 政 反 。 舍 人 误差 和 以 前 
的 一 样 小 ,交换 可 以 像 $12 那 祥 结合 进来 ， 此 外 ,下 次 对 角 线 元 素 
为 1, 在 进一步 化 为 Frobenius 型 时 将 大 量 减 少 舍 人 误差 。 
现在 的 公式 导出 的 了 Hcssenberg 矩阵 可 以 从 5511, 12 的 结果 
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经 对 角 相 似 变换 得 到 。 然而 , 在 后 一 种 情况 妃 的 元 素 关 于 4 的 元 
素 是 线性 的 , 因为 六 的 元 素 关于 a 是 零 次 的 齐 次 的 , 在 现在 的 公 
起 中 如 是 (i 一 i 十 1) 次 的 ， 在 定点 计算 机 工 这 是 不 利 的 。 假 
定 我 们 用 浮 点 ,如果 4 是 平衡 的 ,并 且 4 与 1 相差 很 大 , 我 们 发 
现 已 通常 远 不 是 焉 衡 的 ， 用 $11，$12 的 公式 , 当下 次 对 角 线 元 此 
小 时 :比如 说 , 小 于 2 和 4 时 ,我 们 把 它 看 作 零 ,因而 划分 五 为 两 
个 较 小 的 了 Hesenberg 矩阵 ,而 用 现在 的 公式 ， 我 们 却 没有 这 样 明 
确 的 准则 可 以 利用 。 


直接 确定 特征 多 项 式 


57. 为 了 一 致 性 和 说 明 现在 的 方法 与 Danilewski 方法 的 关 
系 ,我 们 叙述 了 用 相似 变换 确定 Frobenius 型 可 是 , 由 于 我 们 化 
Frobenius 型 的 计算 采用 的 运算 精度 比 化 有 cscnberg 型 的 高 ,因此 
Hessenberg 和 手 阵 占有 的 空间 不 足以 存储 由 它 产 生 的 正 缩 型 矩阵 . 
更 直观 的 方 东 是 直接 推导 号 的 特征 多 项 式 。 这 多 项 式 可 以 
由 递 推 关系 得 到 .。 我 们 逐次 确定 豆 的 各 个 前 主子 矩阵 下 (> 一 
1,……，r) 的 特征 多 项 式 ,车 记 * 阶 子 矩 阵 的 特征 多 项 式 为 zz(1)， 
那么 按照 它 的 第 * 列 展开 det (H, 一 41) 有 
Pa) = 1, P(A) = hu — 2, 
PA) 一 《hr — A ph) — hwkpa2) 
+ 和 art) O— 
TD hh pol 2) 
为 了 导出 p(X) 的 系数 ,我 们 必须 存储 pi(2) 的 系数 (i 一 1, -， 


r+ 一 1)。 计 算 p,(+) 需要 至 妖 次 乘法 ， 因 此 计算 五 的 特征 多 项 


(57.1) 


式 需要 二 和 次 乘法 ,这 个 运算 量 与 用 相似 变换 的 相同 。 如 果 我 们 
决定 计算 双 精 度 的 p,(4), 每 一 个 Pr(1) 也 必须 是 双 精 度 的 。 可 
是 ,如 果 我 们 假定 鼠 的 元 束 只 是 单 精度 的 ,那么 我 们 的 乘法 是 单 精 
度 的 数 乘 双 精 度 的 数 ， 

如 果 某 些 如 小 ,甚至 是 零 ， 也 没有 特殊 困难 发 生 ,虽然 后 一 种 
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情况 划分 为 较 低 阶 的 Hetsenberg, 矩阵 更 容易 处 理 . 如 果 志 是 1 
这 个 方法 也 稍为 简单 一 些 。 

一 般 而 言 , 约 化 矩阵 为 Frobenins 型 (或 计算 特征 方程 ) 远 不 
如 约 化 为 三 对 角 型 令 人 满意 ， 许 多 矩阵 , 其 特征 信 分 布 看 起 来 毫 
无 危险 性 ,但 是 它 的 Frobenius 型 却 是 极其 病态 的 . 双 精度 运算 还 
不 够 的 情况 是 很 平常 的 ， 在 第 七 章 我 们 将 作 较 深入 的 讨论 。 
附注 

虽然 选 主 元 素 的 问题 在 讨论 Gauss 消去 法 时 已 被 广泛 地 研 
究 了 ,但 主 元 素 在 相似 变换 中 的 作用 相对 来 说 被 忽视 了 ， 事 实 上 ， 
它 在 那里 的 影响 甚至 更 加 重要 。 如 果 4 的 初等 因子 是 线性 的 , 我 
们 对 某 个 X 有 “4X 一 X4, 因此 对 于 任何 对 角 和 矩阵 D, 和 D, 有 

(DADT')}D XD, = DXD,A 

《和 矩阵 D, 只 是 给 特征 向 量 引 人 比 俩 因子 ). 我们 希望 选取 D, 使 得 
#(D,XD,) 尽 可 能 小 ， 这 个 问题 对 应 于 矩阵 求 道 时 矩阵 平衡 的 问 
题 。Bauver (1963) 普 对 这 个 问题 作 了 深入 的 讨论 ， 实 际 上 , 这 个 
困难 是 入 们 必须 在 确定 XxX 之 前 选择 P,。 因 此 ,这 个 问题 在 某 些 方 
面 比 求 逆 矩阵 需要 的 平衡 更 加 困难 ，Osborne(1960) 根据 他 的 经 
验 讨论 了 这 个 问题 。 和 符 阵 求 逆 的 问题 一 样 , 我 们 再 次 强调 指出 
平衡 的 必要 性 并 不 与 使 用 选 主 元 素 有 特别 的 关系 ; 它 的 作用 正 像 
使 用 正 交 变换 时 同样 重要 . 

虽然 三 角 分 解 的 紧凑 方案 已 经 长 期 被 使 用 ,但 $11~ $12 讨论 
的 直接 约 化 矩阵 为 Hessenberg 型 的 方法 似乎 是 新 的 ，1959 年 在 
ACE 上 首次 用 了 这 方法 包括 结合 交换 行列 )， 计 算 用 双 精 度 运 
算 , 内 积 用 四 倍 位 字 长 累加 . 

$26 ~335 的 广义 Hessenberg 方法 的 形式 方面 的 讨论 都 是 根 
据 Huseholder 和 Bauer (1959) 的 文章 。 讨论 Lanczos (1950) 
方法 的 文章 很 多 ， 其 中 有 以 下 著者 的 文章 : Brooker 和 Sumner 
(1956)，Causey 和 Gregory 《1961) ，Gregory (1958)，Roser 等 
《1951) 。Rutishauser (1953》 和 Wilkinson 【1958b)。 一 个 可 靠 的 
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确定 特征 值 和 特征 向 量 的 自动 化 方法 随 着 研究 的 深入 慢 蚀 地 出 现 
了 .这 个 算法 的 历史 对 于 从 事 数 入 分析 的 学 者 特别 有 启发 性 。 到 
实际 的 过 程 被 完全 理解 时 , 它 已 被 $43 网 方法 所 取代 ,这 是 具有 讽 
刺 性 的 。 

Bauer (1959》 已 经 给 出 化 一 般 矩 阵 为 三 对 角 型 的 方法 的 一 
般 性 讨论 。 在 他 的 论文 中 , 描述 的 方法 可 能 导出 比 我 们 论述 过 的 
更 优越 的 算法 。 
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第 七 章 压缩 型 矩阵 的 特征 值 


引言 


1 前 一 章 中 我 们 讨论 了 某 些 特殊 型 的 矩阵 , 本 章 的 目的 是 研 
究 这 些 秆 阵 的 特征 值 问题 的 解法 ， 现 在 用 4 表示 这 些 特殊 型 的 矩 
阵 , 我 们 需要 计算 定义 为 

1(2) 一 det(4 — 21) (1.1) 

的 函数 f(z) 的 零点 。 因为 我 们 要 计算 的 是 多 项 式 的 零点 ， 因 此 
本 章 讨论 的 方法 实质 上 都 是 迭代 法 

本 章 讨论 的 各 种 方法 的 效果 都 取决 于 怎样 计算 1(z) ， 可 能 还 
有 某 些 导 函数 在 一 个 趋向 于 零点 的 序列 上 的 值 ， 各 种 方法 的 区 别 
在 于 : 

(i) 计算 1(z) 及 其 导数 的 算法 、 

(ia 逐 项 推导 序列 的 过 程 、 

《ii) 避免 多 次 收敛 于 同一 个 零点 的 技术 . 

这 些 区 别 点 中 ,第 一 个 直接 依赖 于 矩阵 4 的 形式 ,第 二 和 第 三 
个 几乎 不 依赖 于 矩阵 的 形式 。 

在 所 有 方法 中 零点 的 最 后 定位 依赖 于 零点 的 邻 域 中 我 们 得 到 
的 计算 值 。 虽 然 , 在 这 些 邻 域 由 ， 我 们 计算 的 f(s) 的 精度 是 起 决 
定性 作用 的 . 因此 ,我 们 首先 考 志 有 关 的 计算 。 


显 式 多 项 式 形式 


2. Frobenius 型 是 第 六 章 讨论 的 特殊 型 托 阵 中 最 简单 一 个 ， 

它 给 出 显 式 的 特征 多 项 式 或 者 以 两 个 或 本 个 以 上 显 式 的 多 项 式 给 

出 的 特征 多 项 式 的 因 式 分 解 。 z 的 最 高 宕 的 系数 是 1， 因 此 我 们 
考虑 定义 为 

xz) 一 大 十 ar- 十 十 @ {2.1) 
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的 Xc) 的 计算 。 最 简单 的 计算 方法 是 通常 称 作 “ 嵌 套 乘法 ”的 方 
法 。 对 于 = 一 a, 我们 计算 ro (rz 一 2 0)，z(e) 定义 
为 

af(a) 1 se) 一 ona) 十 er (Cr 一 请 一 1 ,0), (2.2) 
显然 我 们 有 fw) 一 a(e). 因为 %(a) 满足 等 式 


ao = J (~), (2.3) 
所 以 计算 的 值 的 范围 可 能 很 大 ,评点 运算 是 必需 的 
计算 的 信 满 中 关系 


sso) 一 1 
(9) = fllasn(e) 十 ar] 
二 atrtta)(1 十 6) 十 or 十 6) (Cr 一 2 一 1 ,0), 
(2.4) 
其 中 


lal <2.2, 1gs| < 2 (2.5) 

合并 这 些 结果 ,我 们 得 到 
(oa) 一 (1 十 Bo)ao tt atl + Era +t et aoll + Eo), 
(2.6) 


其 中 必定 有 


{El < (2r + 1)27%. (2.7) 
因此 ,计算 的 mlw) 的 值 是 系数 为 or(1 十 EE,) 的 多 项 式 在 z 一 a 
上 的 准确 信 ， 因 此 ,尽管 计算 w(a) 时 可 能 发 生 许多 相约 ,其 误差 
可 以 解释 为 在 系数 中 小 的 相对 摄 动 的 影响 . 
然而 要 注意 ,系数 为 r(I + E,) 的 多 项 式 不 能 给 出 其 余 的 计 
算 的 (a)(r 一 1,…,”# 一 1)。 事实 上 ,从 (2.4) 式 我 们 有 
se) on(o)(l + 61) + all + 2) 
Sano) 十 [eal + ea) 十 esrtt(a)8]， (2.8) 
这 表明 给 出 所 有 计算 的 .,(e) 的 多 项 式 的 系数 是 “ij， 它 定义 为 
a = a + 52) + aslo)s,. {2.9) 
假如 把 a, 变 为 a; 看 作 是 小 的 相对 摄 动 ,那么 对 于 所 有 7, sri(o) 


.430® 


必定 是 与 w 同样 数量 级 ， 或 者 是 更 小 一 些 。 对 于 许多 多 项 式 来 
说 ,这 完全 是 不 对 的 。 可 是 如 果 所 有 零点 10 一 1。……，2) 都 是 
实 的 并 且 是 同 号 的 ,那么 对 任何 一 个 零点 的 邻 域内 的 ,这些 条 件 
总 是 满足 的 。 为 了 证 明 这 一 点 我们 注意 到 

Te = (一 oa 立 sa]zr 十 me)， 《2.10) 


从 (2.1) 我 们 有 


a = Eh hs, hi (2.11) 
而 在 (2.10) 中 取 a 一 44s 并 注意 到 so(44) ~ 0, 我 们 得 到 
SU) 一 Ed, i, ¥ A). {2.12} 


这 证 明了 w(ht) 是 与 ar 同 号 并 且 其 绝对 值 不 会 更 大 。 而 由 (2.2)， 
这 意味 着 249 2Mt)1 < 1as|， 因 此 ,从 (2.9) 有 
la ~— ad < Lal 十 hernb)8s) < er12 + 21arl2 
一 3|a,|274, (2.13) 
通常 , 在 计算 多 项 式 时 从 内 积累 加 不 能 获得 很 多 好 处 。 如 果 
我 们 要 造 免 乘 数位 数 不 断 增加 ， 那 么 在 计算 下 一 步 之 前 必须 把 每 
个 sw) 舍 人 .事实 上 ,我 们 有 
se) = Foleosrnle) + er] 
= [arri(a)(l + 6) + ar(l + 62)](1 + 6), 
(2.14) 
其 中 
led <3°2, lel <(15)2%, lel 27 (2.15) 
因此 , “ 中 的 等 价 摄 动 是 2 量 级 的 ,除非 
Isa) | & lal, (2.16) 
即 除 非 是 当 计 算 s+ 时 发 生 严 重 的 相约 。 
1(z) 的 导数 可 以 用 类 似 于 (2.2) 的 递 推 关 系 来 计算 , 实际 上 ， 
对 这 些 方程 求 导 我 们 有 
Ao) 一 se) 十 na) 0) ote) 十 2440c)。 
(2.17) 


并 且 可 以 方便 地 同时 计算 第 一 阶 , 第 二 阶 导数 和 函数 本 身 . 
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3. 我 们 已 经 证 明 , 在 所 有 情况 下 f(a) 的 计算 值 la) 满足 
关系 
so) = Sal + Ewe, |E,| < (C2r + 1)2, (3.1) 
并 旦 指出 了 对 于 基 些 零点 分 布 , 1E,| 的 上 界 可 能 十 分 小 。 在 任何 
情况 下 ,从 统计 的 效果 来 若 忠 我 们 能 期 望 E, 满足 某 个 界限 ,例如 
[El < (2r ft 1)4275, (3.2) 
如 果 显 式 多 项 式 是 从 一 般 矩 阵 化 为 Frobenius 型 得 到 的 ， 在 约 化 
过 程 中 产生 的 系数 的 误差 常常 比 (3.2) 对 应 的 大 得 多 , 因而 多 项 式 
的 实际 计算 决 不 是 整个 计算 中 的 薄弱 环节 ， 
注意 , 摄 动 5, 是 < 的 函数 。 如 果 我 们 用 24%(i 一 1，………, ») 
表示 Za(1 二 E,)z” 的 零点 ,那么 我 们 有 
aa) 一 I(e 一 2)， (3.3) 
然而 fa) 的 真 值 是 


fa) = II(e 一 2)。 《3.4) 


显 式 多 项 式 的 条 件数 


4. 以 约 化 矩阵 为 Frobenius 型 为 基础 的 特征 值 技术 的 弱点 几 
平 完 全 是 由 许多 多 项 式 的 零点 对 其 系数 的 小 摄 动 非常 敏感 引起 
的 。 不 仅仅 是 那些 有 多 重 零点 或 有 极 靠近 的 零点 的 多 项 式 是 这 
样 ， 而且 许 多 多 项 式 ， 其 零点 分 布 表 面 看 起 来 毫 无 害处 的 也 是 如 
此 ， 这些 间 题 ，Wilkinson (1959a) 已 讨论 过 , 它 形成 了 Wiikinson 
(1963b) 第 二 章 的 主要 课题 ， 这 里 ， 我 们 仪 限于 对 已 取得 的 结果 
作 一 个 简明 的 归纳 . 

假设 我 们 考虑 多 项 式 g(x) 的 零点 ,8g(s) 的 定义 是 

gz) 一 用 xz) 十 ast 一 Zarar + Earzt, (4.1) 

我 们 有 下 述 简单 的 结果 

(i) 如 果 罗 是 f(x) 的 单 重 零点 ， 那 么 g(x) 的 对 应 零点 是 
人 (十 1)， 它 满足 关系 


ou ~ 一 at = oo /TE Gu 一 0。 《43 
于 
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(和 如 果 2 是 f(x) 的 荐 重 零点 ,那么 8(z) 用 个 相应 的 
零点 (4 十 841), 这 w 个 值 51 满足 关系 


1 二 
Bhi ~ [—m!l6adt /FO = | —8aat 和 一 2 人 
， ta "OF = [0 /Ho)] 
(4.3) 
在 单 重 夫 点 的 情况 下 我 们 看 出 ，|4#/ TO, 一 | 实际 上 


是 零点 4 的 条 件数 。 我 们 可 以 把 这 个 结果 与 通常 的 矩阵 摄 动 理 
论 在 Frobenius 型 的 应 用 联系 起 来 。 在 第 一 章 511 我 们 看 到 ,对 应 
于 另 一 种 Frobenius 型 的 右 特征 向 量 *; 给 定 为 
(0, A, 1), (4.4) 
用 a 替代 第 一 章 中 的 p,, 对 应 的 左 向 量 定 为 
Yh a + nd tana sp! 
十 ar 十，… 十) (4.5) 
显然 ,我 们 有 好 z 一 了 (2:)。 因此, 与 Frobenius 矩阵 的 摄 动 8 
相对 应 , 的 改变 量 64; 满足 关系 
Bly ~ YF (eB) yx, (4.6) 
如 果 我 们 取 sB 为 对 应 于 wx 的 单个 摄 动 Set 的 矩阵 ,关系 式 (4.6) 
立刻 化 为 (4.2)。 


某 些 典 型 的 零点 分 布 


5 关系 式 (4.3) 直接 证 明了 熟知 的 事实 一 一 多 重 鹤 点 对 于 系 
数 的 小 振动 十 分 敏感 ， 但 对 于 极端 的 敏感 性 常常 与 那些 看 起 来 亮 
无 危害 性 的 零点 分 布 有 关 这 一 点 ,人 们 也 许 没 有 这 样 深刻 的 了 解 。 
因此 ， 我 们 考虑 第 六 章 $23 讨论 Krylov 方法 时 提出 的 每 一 种 分 
布 ， 为 了 说 明 方便 ,我 们 考 典 系 闵 a4 有 摄 动 24g: 的 影响 。 

(GD 线性 分 布 4, 一 21 一 + 
我 们 有 


loa ~ 2 el(21 一 六 (20 一 人 1 一 DL (5.1) 
系数 的 最 级 由 下 式 给 出 、 
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x 十 1Bxz9 二 105228 十 10'z7 十 108x8 十 00x5 十 108z% 
二 109x3 十 103x02 十 1085xn 十 0x 十 10x 二 107z2 
十 108zz 十 103x 十 1093x5 十 108x4 十 1022z3 十 10x? 
十 10%x 十 10”. (5.2) 
一 个 宛 长 的 琐碎 的 演算 表明 ,最 敏感 的 是 零点 z 一 16(i 一 5) 
对 于 ae 的 摄 动 的 敏感 性 .事实 上 ,我 们 有 
164s| 27710"(C16)5/15141 se 27(0.38)105.。 (5.3) 
这 表明 除非 2- 比 10-* 小 得 多 , 否则 摄 动 后 的 堆 点 与 原来 的 真 什 
毫 无 共同 之 处 。 大 多 数 的 较 大 的 零点 对 于 * 的 高 坚 次 项 的 系数 的 
摄 动 十 分 敏感 . 
表 1 说 明了 这 个 现象 , 表 1 中 我 们 列 出 了 只 有 xz 的 系数 有 报 
动 2 人 2 的 结果 , 这 是 一 个 约 为 ?的 改变 ， 10 个 零点 已 变 为 复 的 ， 
且 生 部 是 实质 性 的 ! 另 方面 较 小 的 零点 的 敏感 性 是 适当 的 , 这 
可 以 从 (5.1) 验 证 。 


表 1 


一 -一 一 -一 一 一 -一 一 
多 项 式 《x 一 1)(x 一 2)…(x 一 20) 一 2 2x ”的 零点 ,正确 到 小 数 点 后 ? 位 . 
1.00000 0000 6. 00000 6944 10.09525 6145 二 0.64350 09047 
2.00000 0000 6. 99969 7234 11.79363 3883 士 1.65232 9728i 
3.00000 0000 8. 00726 7603 13.99235 8137 士 2.51883 0070i 
4.00000 0000 8- 91725 0249 16.73073 ?466 士 2.81262 489 第 
4.99999 9928 。 20.84690 B101 19.50243 9400 士 1.94033 0347 


《ii) 线性 分 布 4, 一 11 一” 
我 们 现在 有 
loa 2a O20 — DIG ~ D!. (5.4) 

与 ($5.1) 相 比 , 我 们 看 出 (11 一 说 * 代替 了 因子 (21 一 i)*, 系数 
的 量 级 由 下 式 表明 
x 十 10x93 十 108xi 十 T04z7 十 105x 十 104x2 十 107x* 

十 105x5 十 109xz2 十 10x 十 10Px9 上 104 十 100x8 十 109x7 

十 10pzs 十 10axs 十 102z4 十 102z5 十 10 十 100x,， (5.5) 
最 敏感 的 关系 是 4s 对 se。 我 们 有 
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182s| = 2 一 eicj8s/21171 se 275(0.4)107. (5.6) 
因此 , 和 (i 的 情况 相 比 ， 现 在 多 项 式 的 条 件 是 好 得 多 了 。 注意 ， 
如 果 4 有 特征 信 (21 一 站， (4 一 107) 就 有 特征 信 (11 一 让. 
因此 ,在 原 和 矩阵 上 这 个 比较 平凡 的 改变 给 它 的 Frobenius 型 的 条 件 
带 来 深远 的 影响 ,对 第 六 章 描 述 的 化 矩阵 为 三 对 角 型 和 Hessenber8 
型 , 则 上 述 结论 不 成 立 ， 对 于 这 两 种 矩阵 , 原 和 矩阵 的 改变 为 好 ,在 
导出 的 矩阵 中 也 产生 改变 7, 因此 导出 的 矩阵 的 条 件 与 这 种 改变 
无 关 。 

《证 )》 几何 分 布 4 一 2 一 
多 项 式 的 系数 大 小 十 分 悬殊 ,其 数量 级 由 下 式 给 出 , 
Ee 
十 2 十 2 十 208 十 250 十 29x? 二 2 
十 2 + 2 + 2 十 294xt 十 2 生计 
+ 2790 十 29x 十 2 和。 (5.7) 
对 于 前 桓 两 种 分 布 , 我 们 攻 虑 了 零点 的 绝对 的 改变 。 但 是 零点 的 
量 级 变化 很 大 时 ,也 许 孝 赔 相 对 摄 动 更 合理 ,我 们 有 
lef4sl ~ 2 lorl27%f PQ|, (5.8) 
其 中 
P= (27 — 2 2 (2 2-7), (5.9) 
QO 0 22) 0) (5.10) 
我 们 可 以 写 
IP = 2 — 20 2) 0)], (5.11) 
18| 一 2o9[(L 一 29(1 200) — 272+7)], (5.12) 
两 个 方 括号 内 的 表达 式 都 收敛 于 无 穷 项 的 乘积 
(1 一 2901 一 2 (1 一 2 (5.13) 


并 且 有 一 个 很 粗粮 的 不 等 式 证 明 它 落 在 二 和 二 之 间 ， 因 此 我 们 


有 
4614 一 21a12st4， 其 中 6 一 到 41 2 一 7). (5.14) 


对 一 个 周 定 的 值 , 当 i 一 20 一 万 时 , 它 达 到 极 大 值 , 因此 我 们 有 
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(64141) < 2 lar] 2+4 mA (5.15) 
从 (5.7) 可 以 验证 


Nar 4.274070t 0, {5.16) 
因此 ,最 终 任何 系数 的 相对 报 动 不 大 于 2 时 都 有 
152724 25 (5.17) 


所 以 对 这 样 的 与 计算 多 项 式 时 产生 的 误差 相当 的 摄 动 ， 零 点 都 是 
十 分 良 态 的 . 
自然 会 间 , 当 特征 全 的 量 级 变化 很 大 时 ,我 们 是 否 能 得 到 相对 
误差 小 的 特征 方程 系数 。 可 惜 , 答案 是 : 一 般 而 言 , 我们 不 能 得 
到 ,我 们 用 一 个 十 分 简单 的 例子 来 说 明 , 考 虑 矩阵 
_ [ "2521 81356 ] 
0.59592 0.76325 ] ， 
它 的 特征 值 1 一 10:(0.13985), 4 一 10- 汶 0.52610), 准确 到 5 位 
有 效 位 。 我 们 可 以 用 相似 变换 MD-4M, 化 这 和 抢 阵 为 Frobenius 型 ， 
其 中 


(5.18) 


, m=[! 10:(—0. 942908)] (5.19) 
但 是 ,尽管 用 了 浮 点 运算 ,计算 的 变换 却 是 
[9 107*(—0.20000) (5.20} 
0.59592 0 “ 


在 计算 (1,2) 元 素 时 , 发 生 了 严重 的 相约 , 给 出 特征 多 项 式 常数 项 
的 计算 的 元 素 几 乎 没有 一 位 是 正确 的 .一般 特征 值 的 大 小 差 相 悬 
殊 的 时 候 ， 所 得 的 Frobeoius 型 中 的 元 素 势 必 具 有 同样 数量 级 的 
绝对 误差 , 而 这 对 于 小 的 特征 值 的 相对 精度 是 致命 的 影响 ; 例如 ， 
在 第 (说 ) 类 密 点 分 布 的 情况 下 , 多 项 式 常 项 的 10 数量 级 的 绝 
对 误差 显然 使 得 零点 的 乘积 从 2 变 为 (2 十 10-"), 后 者 约 是 
前 者 的 103 倍 ! 
有 些 特 殊 的 矩阵 不 会 发 生 这 种 恶化 ,一 个 简单 的 例子 是 矩阵 
10°(0.2632) 10-5(0.3125) 
[ 10"(0.4315》 10-:(0.2873) ] (521) 
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虽然 ,这 个 矩阵 有 一 个 数量 级 为 工 的 特征 值 , 另 一 个 是 10… 量 级 ， 
但 在 推导 Frobenius 型 时 没有 发 生 相 约 。 

(iv) 环形 分 布 4 一 exp (rmz/20)。 
对 应 的 多 项 式 是 z2 一 1, 并 且 我 们 有 


lan ~ l8eal 2314/ 05)1 = 二 laal. (5.22) 


这 个 多 项 式 的 零点 都 是 十 分 良 态 的 。( 因 为 大 多 数 系数 是 零 , 在 这 
种 情况 我 们 没有 考虑 相对 气动 ,) 


Krylov 方法 的 总 评述 


6. 上 一 节 的 分 析 证 实 了 我 们 在 第 六 章 $25 所 作 的 预言 , 即 关 
于 Krylov 方法 应 用 于 特征 值 如 55 的 各 种 分 布 的 矩阵 的 效率 的 预 
言 ， 对 于 (i) 那样 的 分 布 ,用 62 位 二 进位 运算 执行 通常 的 Krylov 
方法 是 很 不 够 的 ， 计 算 的 特征 方程 的 零点 不 大 可 能 与 原 答 阵 的 特 
征 值 有 什么 关系 ， 尽 管 对 第 (i) 类 是 这 样 ,但 是 , 对 关系 密切 的 第 
ii) 类 分 布 ， 计 算 的 特征 方程 却 要 精确 得 多 ,并且 它 是 非常 良 态 
的 。 


在 第 六 章 325 我 们 已 看 出 如 (二 ) 那样 的 分 布 ， 计 算 用 到 62 
位 二 进位 , 所 得 的 特征 方程 是 无 法 辨认 的 。 真正 的 特征 方程 的 堆 
点 对 于 系数 的 小 的 相对 报 动 并 不 敏感 ， 但 这 个 性 质 现在 是 没有 
用 的 。Krylov 方法 对 这 样 的 分 布 是 不 切合 实际 的 ，。 

现在 我 们 转 到 考虑 分 布 (iv) 的 情况 ,我 们 发 现 不 仅 Krylov 方 
法 十 分 准确 地 定 出 特征 方程 ,而 且 特 征 方 程 本 身 也 是 十 分 良 态 的 。 
对 于 具有 这 种 分 布 的 乱 阵 。Krylov 方法 十 分 有 效 , 甚至 只 须 用 单 
精度 运算 . 

综 上 所 述 ， 虽 然 Kryiov 方法 对 于 特征 值 在 复 平面 上 的 分 布 
是 “好 "的 矩阵 是 有 效 的 ,但 是 作为 通用 方法 有 严厉 的 限制 。 


显 式 多 项 式 的 总 评述 
7. 显然 ,对 于 4 一 21 一 ?0 一 1 ;20) 这 种 分 布 , 化 矩 
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阵 为 Frobenius 型 ， 不 管用 什么 方法 都 必须 用 高 精度 运算 才 可 能 
使 它 的 特征 什 接 近 原 矩阵 的 特征 信 ， 此 外 ,因为 计算 的 f(a) 的 误 
差 相当 (2.6),(2.7) 式 表明 的 系数 的 振动 ,所 以 计算 f(a) 必须 用 局 
样 高 的 精度 运算 。 
值得 注意 的 是 ,对 于 55 的 第 (D 类 分 布 , 通常 对 于 一 20 的 
邻 域内 的 < 值 ,除非 用 高 精度 运算 ， 否 则 计算 的 1(z) 没有 正确 的 
数字 ， 例 如 ,我 们 考虑 当 # 一 20.00345645 用 10 位 十 进位 浮 点 运 
算计 算 fs)。 在 找 套 乘法 的 第 二 步 ,我 们 计算 see 为 
si9(2) 一 zfz) 十 ap 一 20.00345645 X 1 — 210.0, (7.1) 
正确 值 是 一 189.99654355， 但 是 如 果 我 们 用 的 是 10 位 数字 , 它 必 
定 被 一 189.9965436 所 代替 . 即使 在 筷 赛 乘法 中 再 没有 发 生 误 差 ， 
从 这 一 次 舍 人 ,导致 最 后 的 误差 是 
5X10-%(20.00345645) (2.6)10°. (7.2) 
现在 , 我 们 为 了 简洁 起 见 ， 写 x 一 0.00345645，f(Ce) 的 正确 值 
是 
x(1 x)(2 + x7)...(19 + x). {7.3) 
并 且 落 在 191* 和 201z 之 间 , 这 就 是 落 在 (4.2)10* 和 (8.4)10 之 
岂 ， 这 个 第 一 次 舍 人 的 误差 使 f(z) 的 计算 值 与 真 信和 相差 一 个 
量 ,这 个 量 比 真 值 本 身 大 得 多 . 
在 病态 的 零点 的 邻 域内 ,一 个 单调 的 z 的 序列 上 ,计算 的 1(2) 
的 值 可 能 完全 不 是 单调 的 。 这 在 表 2 中 有 很 好 的 说 明 。 


囊 2 
= fz) 的 计算 什 Kz) 的 真 信 
0 十 2 位 +0.63811--. 10-4( 十 0.16501…) 
10 二 2XX2 全 十 0.57126.… 10( 十 0.3303…) 
043X2 一 0.31649.-- ， 被 使 人 误差 支配 10-4C+0.49505...) 
10427 47X24 于 0，29389.… 10-( 十 0.27048… 
10+273+7X20 二 0.70396-.. 101C4+0.86518..) 
10+2- +7X2 | 301C40.33456..) 10(+0.27685..") 
10+2797X2 | 10°C40.89316.:) 107( 十 0.88508…) 
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表 2 中 我 们 给 出 了 对 = 在 10 的 令 域 内 的 值 由 多 项 区 [TI (z 一 7) 


得 到 的 计算 值 。 为 了 表明 伟人 误差 的 特点 ,在 最 后 四 个 = 中 把 项 
?7X2-” 也 包 揪 进来 是 必要 的 ,否则 z 可 能 已 经 以 许多 零点 结束 
了 。 我 们 是 用 尾数 有 46 位 二 进位 的 评点 运算 和 准确 的 显 式 表达 


式 计算 多 项 式 的 。( 因 为 这 样 的 字 长 不 能 准确 表示 [[ (* 一 +)， 


因此 我 们 不 用 它 .) 

对 于 * 的 值 从 10 到 大 约 是 10 二 2"”, (x) 的 计算 的 值 是 1 数 
基 级 , 它 与 顽 值 毫 不 相 十 。 原 因 是 计算 值 完 全 由 含 人 误差 支配 ; 正 
如 我 在 (2.13) 见 到 的 , 这 些 误差 等 价 于 e 中 大 到 31a,| 的 摄 动 ， 
对 于 距离 10 较 远 的 “ 值 , 我 们 得 到 几 位 正确 的 有 效 位 。 事实 上 ， 
如 果 s 一 10 十 x, |xi 是 2 量 级 ,那么 一 般 情 况 下 ,计算 的 
f(x) 值 大 约 有 20 一 个 正确 的 有 效 位 ， 虽然 有 候 然 的 情况 , 意外 
有 利 的 舍 人 误差 可 能 给 出 更 精确 的 结果 。 如 果 用 尾数 46 位 二 进 
位 运算 和 显 式 多 项 式 计算 f(z) 的 值 ， 人 们 几乎 不 能 期 望 任何 基 
于 这 些 计算 值 的 挝 代 技 术 去 确定 零点 > 一 10, 其 误差 会 小 于 


2 


三 对 角 和 矩阵 


8. 现在 我 们 转向 计算 det(4 一 *7)， 其 中 4 是 三 对 角 抑 阵 . 
如 果 写 
1 (8.1) 
并 用 (x) 表示 (4 一 21) 的 了 阶 前 主子 式 。 那 么 按 最 后 的 一 行 
展开 p.(z), 我 们 有 
和 (Co = (0 — se)pr-ila) — PrY ipals) (7 = 2 7), 
(8.2) 
其 中 
Prt) 一 1， Pils) 一 加 一 sy {8.3) 
乘积 8.7, 可 以 一 次 计算 好 。 我 们 可 以 假定 8.Y, 天 0, 否则 我 们 
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可 以 把 拭 阵 划分 为 较 低 阶 的 三 对 角 矩 阵 来 处 理 。 每 一 次 计算 需 腊 
2 次 乘法 。 
如 果 需 要 det(4 一 #1) 的 导数 ,我 们 可 以 在 计算 函数 的 同时 
计算 出 来 。 事 实 上 ,对 (8.2) 的 求 导 我 们 有 
六 (CD = (or — 2)prle) — Borba) — bra) (8.4) 
和 
Pr (2) — (or — 2)pr ls) — BrP ls) — 2prsl®). 
(8.5) 
因为 函数 值 的 计算 精度 是 计算 的 零点 的 精度 的 主要 限制 ， 我 们 只 
作 按 (8.2) 实 现 的 算法 的 误差 分 析 ， 实 际 计算 中 , 浮 点 运算 是 必 不 
可 少 的 ,计算 的 值 满足 关系 
prs) = fl[(0, 一 =)p-i(z) — Br pre)] 
二 (ov —s)(1 + e)prls) — PT(l + Ea)prs(2), 
(8.6) 


其 中 
lal <3.274, [el < 3.275, (8.7) 
因此 ,与 对 称 的 情况 一 样 (第 五 章 $40)， 计 算 的 序列 对 于 元 素 是 
or，P，Y' 的 三 对 角 甜 阵 是 准确 的 ,其 中 
s(te), Pr Br(l te),. (8.8) 
因此 ,我 们 可 以 假定 


彤 一 PE 十 8 YI t+)i, (8.9) 
这 使 得 如 和 7; 对 应 小 的 相对 误差 ， 另 一 方面 我 们 有 
0 CO— or = (0 — 2)es, {8.10) 


我 们 不 能 保证 这 对 应 于 w 的 小 的 相对 误差 , 但 是 我 们 可 以 只 考虑 
某 些 <z 值 ,这 些 z 值 满足 不 等 式 
1z| < lAls 一 max(l7i] + le + Pie) (8.11) 
这 使 得 w 的 摄 动 相对 4 的 范 数 是 小 的 、 
9. 注意 ， 如 果 也 是 任 一 个 失 4 经 过 对 角 相 似 变换 得 来 的 矩 
阵 , 虽然 这 两 个 矩阵 的 特征 值 的 条 件数 一 般 不 同 ， 但 是 o, 和 乘积 
By， 是 相同 的 。 对 于 所 有 这 样 的 4， 计算 的 序列 p(x) 是 一 样 
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的 。 例 如 给 定 矩 阵 4 为 
0.2532 28(0.2615) 
2-23(03125) 0.3642 0.1257 
0.2135 0.4132 
为 了 便于 进行 有 关 的 误差 分 析 , 我 们 可 以 用 矩阵 让 来 研究 ,入 给 定 
为 


4 一 ， (9.1) 


0.2532 21(0.2615) 
2°(0.3125) 0.3642 -0.1257 
0.2135 。 0.4132 
当然 我 们 要 限制 试验 值 > 的 范围 是 |z| 所 13ls 而 不 是 1z| 所 
14lls， 一般、 我们 可 以 考虑 用 矩阵 4 经 过 "平衡 "得 到 入 来 讨论 . 
109。 如 果 已 经 用 相似 变换 把 一 个 一 般 形 式 的 矩阵 化 为 三 对 角 
拭 降 ,那么 只 亡 在 两 个 阶段 都 用 相同 精度 的 计算 ,实际 上 可 以 肯定 
三 对 角 矩 阵 的 误差 将 大 于 多 项 式 计算 的 误差 。 在 第 六 章 $49 我 们 
建议 ， 即 使 Hessenberg 阵 矩 是 用 单 精度 运算 通过 相似 变换 得 出 
的 ,我 们 也 用 双 精 度 运算 把 Hessenberg 阵 矩 化 为 三 对 角 和 矩阵 这 
是 为 了 防 正 约 化 三 对 角 矩 阵 的 过 程 中 可 能 出 现 的 “不 稳定 "。 人们 
自然 会 问 , 计算 pr(x) 时 是 否 又 可 以 用 单 精 度 运 算 呢 ? 如 果 在 化 
三 对 角 矩 阵 时 没有 出 现 不 稳定 ,恢复 单 精度 运算 是 十 分 适 宣 的 ,但 
是 如 果 发 生 不 稳定 ,恢复 单 精度 运算 是 致命 的 ,一 个 十 分 初等 的 分 
桥 可 证 明 为 什么 这 是 真 的 。 
在 第 六 章 $46 我 们 已 看 出 , 当 过 程 出 现 不 稳定 时 ,对 应 的 三 对 
角 矩 阵 的 元 素 的 量 级 一 般 可 以 用 下 面 的 有 代表 性 的 形式 来 表示 
1 1 | 
1 1 1 
2 2 24 
24 24 2 
1 1 1 


， (9.2) 


六 二 


(10.1) 


这 里 特征 信和 是 1 的 数量 级 ,而 不 是 如 范 数 所 了 暗示 的 24 量 级 。 我 们 
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还 证 明了 规范 化 为 yx 一 ! 的 左 、 右 特征 向 量 》 和 x* 的 分 量 的 量 
级 是 
15 = (1, 1, 2*, 2*, 1, 1), 
1 = (01, 1,1,1,1,1). 
现在 58 的 误差 分 析 经 表明 ,对 应 于 使 用 : 位 运算 的 计算 的 等 价 
接 动 的 量 级 十 


(10.2) 


[Ti 1 
1 1 1 
B=—2™ 2 2 2 {10.3) 
2 24 2 上 
1 11 


_ 1 1 
因此 ， 从 第 二 章 $9, 特征 值 的 摄 动 的 量 级 一 般 是 yTBx/y'x 的 量 
级 ,并 且 

JrBz1yzz mm O27). (10.4) 
这 说明 计算 多 项 式 的 运算 精度 应 该 和 约 化 矩阵 为 压缩 型 的 根 周 ， 
但 是 正如 第 六 章 $49 中 所 说 明 的 , 双 精 度 运 算 一 般 是 足够 的 ,除非 
原 矩 阵 本 身 是 过 于 病态 。 因此 ， 这 种 算法 比 Frobenius 型 的 情况 
好 得 多 。 


Hessenberg 矩阵 的 行列 式 


11. 最 后 我 们 考虑 4 是 上 Hessenberg 矩阵 时 ,对 于 指定 的 = 
值 计算 det(4 一 z1)， 我 们 再 次 发 现 可 以 用 一 个 简单 的 递 推 关 系 
达到 目的 ,这 关系 的 推导 如 下 〔(Hyman 1957)， 设 

P 一 4 一 z1， (11.1) 

P 卫 的 列 记 为 p., 所 ,……，pr。 假定 我 们 可 以 找到 纯 量 mo 
xu-ay ""…"s xi 使 得 

7 让 十 xi 护士 :十 xipo +F pa = Ra)e, 《11.2) 

这 就 是 说 ,左边 的 向 量 除了 第 一 分 量 之 外 全 是 零 , 于 是 用 te, 代替 

P 的 最 后 一 - 列 形成 的 撼 阵 吕 显然 与 P 有 相同 的 行列 式 . 因此 ， 按 
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2 的 最 后 一 列 展 开行 列 式 , 我 们 得 到 
det(4 一 zs1) 一 detP 一 detg 一 + Yaa 


mm 一 ln 


(11.3) 


元 素 oro; 起 着 特殊 的 作用 ,我 们 用 新 记号 来 强调 它 ， 
Gitni = Bir (11.4) 
利用 (11.2) 式 两 边 的 第 wa 一 1,.…, 2 元 素 相等 ， 我 们 可 
以 逐个 计算 xs- xs-2，……, xi 于 是 我 们 得 到 
tr 十 (er — zx +t at 十 ar 0 
(r =n, + 2), (11.5) 
其 中 x。 一 1。 最 后 从 第 一 分 量 相等 得 到 
(eu 一 3)xi 十 ant 十 十 aiets 一 大 (7 (11.6) 
(4 一 a7) 的 行列 式 与 (有) 只 差 一 个 常数 倍数 ,因此 我 们 可 以 集 
中 力量 找 《(x) 的 零点 。 在 每 一 次 计算 中 有 十 民 次 乘法 。 如 果 


矩阵 的 下 次 对 角 元 素 5, 都 是 1， 那么 *,_, 不 用 除法 就 可 以 计算 。 
在 第 六 章 $56 我 们 已 看 到 假如 用 浮 点 运算 ， 产 生 这 种 特殊 形式 的 
上 Hessenberg 型 是 十 分 方便 的 。 可 是 ， 我 们 对 除了 假定 它 是 
非 零 之 外 不 作 其 它 任何 假定 , 如 果 任 何 5, 是 零 ， 我 们 可 以 分 为 几 
个 低 阶 的 Hessenberg 短 隆 的 问题 、 
我 们 可 以 用 类 似 的 递 推 关系 得 到 f(x) 的 导数 。 (11.5) 和 
(11.6) 关 于 x* 求 导 ,我 们 得 到 
Bex +t Carr — Er + a tT at Ox = 0 
(11.7) 
《ea 一 中 让 二 20 本 二 二 Got 一 一 上 (2)。 (11.8) 
因为 mm 一 1, 所 以 如 一 0。 关 于 二 阶 导 数 , 存在 类 似 的 关系 , 因 
此 x 和 《(x) 的 导数 可 以 和 函数 本 身 同时 计算 。 


例 人 误差 的 影响 


12. 对 于 计算 (11.5) 定义 的 ;， 用 浮 点 运算 是 非常 必要 的 ，。 
计算 的 x-1 是 根据 下 述 关 系 用 计算 的 x (i 一 +，,……,#) 给 出 的 ; 
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—xr flarmrs 十 + anetizrt + am 一 zzrj2] 
= amoral 十 Be) tT antral 十 err) 
士 (er 一)xzr(I + er)}(l + DAIL (12.1) 
其 中 
lsnl <G—r + 2)2 全 G> 7), 
le 3. 2274, le:| 委 2 一 (12.2) 
因此 , 对 于 矩 降 元 素 为 a 和 疼 的 矩阵 来 说 。 计算 是 准确 的 , 这 些 
元 素 的 定义 是 
mi 一 anf(1 十 sr) 18 一 但 一 十 2)22 人 > 人 
ar 一 anr(l 十 sr) 一 sgr，|8so| <3. 2 
多 一 和 (二 和) <2 
(12.3) 
可 能 除了 sr 之 外 , 这 些 元 素 的 相对 误差 都 小 , 但 是 我 们 只 对 满足 
下 述 不 等 式 的 > 值 感 兴趣 
le| < 站 4 (12.4) 
因此 ， 
je 一 ar| < {lanl + 1A} lenl, 《12.5) 
这 表明 这 个 摄 动 与 4 的 任何 一 种 范 数 相 比 都 是 小 的 . 
作为 一 个 例子 ， 我 们 若 虑 一 个 矩阵 4 其 元 素 的 模 不 大 于 1， 
因此 我 们 得 到 


ll < ld < 下 (十 3 一 2 《12.6) 


等 价 的 摄 动 矩阵 , 它 是 x 的 函数 , 是 以 矩阵 下 一 致 月 界 的 。= 一 5 
时 ,的 形式 为 


4 5 
3 4 
3 3 士 引 4lls2-a7。 C12.7) 
1 3 


ww 


1 
它 具 有 代表 性 ,因为 |4fz 一 0(x), 我 们 有 
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llFls ~ 2-2(z/12), 当 »— oo。 (12.8) 

我 们 再 一 次 发 现 , 除非 特征 值 对 于 Hesscnberg 型 矩阵 的 元 素 

中 最 后 一 位 数字 的 报 动 极其 敏感 ， 否 则 在 行列 式 计算 中 的 误差 是 

不 严重 的 。 在 第 六 章 我 们 已 介绍 了 一 些 约 化 矩阵 为 Hessenberg 型 

的 很 稳定 的 方法 。 所 以 , 在 正常 情况 下 单 精 度 运算 对 约 化 过 程 及 
行列 式 计算 都 是 够 的 ,除非 原 矩 阵 是 过 分 病态 的 。 


评点 聚 加 


13. 虽然 上 一 节 的 结果 绝 不 使 人 感到 不 满意 ， 但 是 使 用 浮 点 
累加 运算 作 Hessenberg 矩阵 的 行列 式 计算 , 其 结果 的 误差 界 要 小 
得 多 。 为 了 充分 利用 累加 的 优点 ,我 们 应 该 用 关系 

—%r = fl {arms 十 tare 十 arrxr 一 zf2]， 

(13.1) 
从 H(i 一 +，…,z) 计算 ”- 注意， 我 们 写 的 是 arxr 一 sz 
而 不 是 (aw 一 *) r， 因为 计算 sr 一 * 时 可 能 引进 单 精度 会 人 误 
差 。 等 式 (13.1) 给 出 
一 zi 一 [emxn(1 士 Bo) 十 … Tarx(l + ey) 


— zx(1 +t)I(l + er)fb,, (13.2) 
其 中 
en| < 15 人 一 > 士 3)2-29， jl <3.27m, |e,l S27 
(13.3) 


所 以 这 个 计算 对 于 元 素 为 a 和 5 的 矩阵 是 准确 的 ， 这 些 元 素 定 
义 为 
1 =an(l + gn), [gil <1.50 一 > 十 3)2-25 
人 一 0 十 1) 
ar ea 人 (1 十 er) 一 ar en < (45)2 29 < 3 2 
Bb(lté), |é,| 一 2 
{13.4) 
为 了 说 明 结果 ,我 们 仍然 考 忠 所 有 元 素 的 模 都 不 大 于 1 的 乱 降 4， 
其 等 价 的 报 动 现在 以 矩阵 为 界 , 当 # 一 5 时 ,F 为 
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34567 
3 4 5 | 
已 一 【1.5)2-2 3 4 5 
3 | 
3 

o00000 

10 0 0 0 

十 3 让 .42-257 十 2 1 0 0 0|， (13.5) 
1 0 0 
1 0 


在 一 般 情况 下 ,上 式 右边 的 三 个 矩阵 的 2- 范 数 的 界 分 别 是 

1.5(2 十 2)22-2a1125， 3.0(# 十 2)2-za72 于 和 2. 
因此 , 只 要 m2 明显 地 小 于 1, 那么 | 有 | 实际 上 是 2 ， 这 是 一 
个 最 好 的 结果 。 


用 正 交 变换 计算 


14. Hyman 的 计算 方法 的 实质 是 以 Se 型 初等 矩阵 〈 第 一 章 
$40 (iy)) 右 乘 Hessenberg 和 矩阵 ，S， 的 那些 关键 的 元 素 是 选 得 使 
和 矩阵 的 最 后 一 列 变 为 < 的 倍数 ， 对 于 以 前 讨论 的 各 种 情形 ,我们 
已 看 到 选 主 元 素 对 于 数值 稳定 性 是 有 决定 性 作用 的 ， 但 是 $12， 
$13 的 误差 分 析 已 证 明 ,现在 的 情况 下 选 主 元 素 不 起 作用 , 并 且 用 
大 的 碟子 * 没有 危害 性。 按 同 样 的 方式 , 我 们 能 看 出 ， 虽 然 我 们 
用 了 去除 元 素 , 尽管 它们 可 以 是 小 的 量 ， 但 是 没有 坏 影响 ， 行 
列 交换 可 以 结合 到 计算 中 使 用 。 但 是 在 现在 情况 下 并 没有 什么 有 
用 的 目的 。 在 下 一 段 我 们 考虑 使 用 平面 旋转 时 ,引进 交换 的 方式 
会 得 到 说 明 . 

对 于 数 信 不 稳定 的 担 优 是 一 个 误解 ， 但 是 它 已 导致 人 们 建议 
采用 平面 旋转 . 《例如 , 见 White (1958))， 这 个 方法 由 (x 一 1) 
步 组 成 , 第 7 步 中 , 矩阵 的 最 后 一 列 第 (= 一 7 十 1) 元 素 化 为 零 。 
当 ” 一 5，r 一 3, 第 * 步 开始 时 ,矩阵 的 形状 是 
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。 {14.1) 


x 
x 
X X X X 


X X X 
乙 XX X X 


X 0 

第 " 步 是 用 一 个 旋转 矩阵 右 乘 , 旋转 平面 是 (nw 一 +, x)、 转 角 被 
选取 使 每 es-,s*uw 化 为 零 , 这 些 步 贡 是 : 

GD) 计算 > 一 〔 吕 -十 号- 全 

(ii 计算 cos9 一 -rafz 和 sin0 一 ee-rruofzs 

(下 ) 对 于 了 从 1 到 ”一 r*。 计 算 gj,o-rcos 9 十 ainsin8 和 
一 eim-rsing 十 siecosg。 并 分 别 覆 盖 在 as-， 和 zie 上。 

(iv) 用 x 代替 和 -vt 用 零 代 替 “ooe。 显 然 , 第 # 一 + 列 和 
第 ” 列 被 它们 本 身 的 线性 组 合 所 代替 ， 以 前 各 步 引进 的 零 元 素 不 
受 影 响 。 

最 后 的 矩阵 与 Hyman 方法 的 有 同样 形式 ,其 行列 式 是 


a 
入 一 tan IT br (14.2) 
7 


现在 ， 用 普通 的 方法 容易 证 明 所 计算 的 行列 式 是 对 应 于 某 个 矩阵 
(4 + 54) 的 准确 值 。 对 于 标准 的 浮 点 计算 有 
lealls < Ka 让 4 (14.3) 
因此 , 这 个 方法 是 稳定 的 ， 但 是 它 的 界 不 如 用 浮 点 计算 的 Hyman 
方法 好 。 从 关系 式 (12.3) 到 (12.5) 我 们 必定 有 
lsalis < KnllAlls. {14.4} 
可 是 ,对 用 祥 点 累加 运算 的 Hymsn 方法 我 们 有 更 好 的 结果 。 
15. 平面 旋转 的 算法 需要 4 倍 的 乘法 量 ， 我 们 可 以 无 条 件 地 
说 ， 不 带 行列 交换 的 初等 变换 是 更 优越 的 。 Hyman 方法 还 有 一 
个 优点 ,我 们 的 分 析 没有 上 明显 地 反映 出 来 。 我 们 已 经 指出 ,计算 的 
行列 式 是 (4 + 84) 的 准确 的 行列 式 ， 并 且 对 于 4 的 每 一 个 非 堆 
元 素 , 我 们 已 得 到 如 下 形式 的 界 ， 
lsaa! < 2 站 te。 (15.1) 
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现在 ,我 们 考 卉 (4 十 84) 的 任何 对 角 棚 似 变换 ,这 样 的 变换 可 表 
示 为 D (4 十 84)D 一 和 十 34. 显然 , 5 和 和 广 的 元 素 之 间 的 关 
系 与 54 和 4 的 元 素 之 间 的 关系 是 相同 的 ， 在 估计 摄 动 54 对 4 
的 特征 值 的 影响 时 。 我 们 可 以 用 4 的 最 为 良 态 的 对 角 根 似 变换 讨 
论 . 所 以 ,执行 Hyman 方法 之 前 不 必 对 托 阵 4 作 平衡 。 这些 夏 
法 不 适用 于 正 交 变换 的 或 带 行列 交换 的 初等 变换 的 算法 . 


一 般 和 矩阵 的 行列 式 计 算 


16. 在 开始 研究 计算 零点 的 迭代 潜 之 前 ， 我 们 先 处 理 三 个 与 
我 们 一 直 在 讨论 的 问题 有 关 的 课题 ， 第 一 个 是 计算 一 般 特 阵 的 行 
列 式 det(4 一 #1)。 正如 第 四 章 中 我 们 指出 的 ,任何 一 个 用 稳定 
的 初等 变换 或 者 正 交 变 换 化 矩阵 为 三 角形 抵 阵 方法 ， 都 将 提供 一 
个 稳定 的 计算 行列 式 的 算法 。 如 果 能 作 内 积累 加 , 带 行列 交换 的 
直接 三 角形 分 解 是 特别 受 欢迎 的 。 这 样 的 方法 的 级 点 是 工作 量 大 


而 不 是 稳定 性 问题 . 单独 计算 行列 式 至 少 要 了 名次 乘法 ,但 是 如 


果 先 化 为 Hessenberg 型 ,计算 行列 式 只 要 pa 次 乘法 。 


广义 特征 值 问题 

17. 第 二 个 课题 是 关于 = 个 ” 阶 的 联 立 微分 方程 的 解 ， 在 第 
一 章 8$30 中 我 们 业已 指出 , 它 归结 为 一 个 广义 特征 值 问题 ,其 中 我 
们 要 计算 的 是 下 式 的 零点 ， 
det[ 了 十 Bist 二 -Bs le)] = detlCCe)], (17.1) 
虽然 可 以 把 问题 化 为 标准 特征 信和 间 题 ， 但 是 对 应 的 矩阵 是 nr 阶 
的 ， 所 以 按 下 述 方式 直接 处 理 (17.1) 是 有 利 的 。 对 于 每 一 个 # 值 
计算 矩阵 C(z) 的 元 素 , 这 需要 大 约 mr 次 乘法 。 然 后 可 用 第 四 章 
描述 的 任何 稳定 的 三 角形 化 方法 计算 C Cx) 的 行列 式 值 。 最 节省 


的 方法 需要 地 次 科 法 。 因为 《(z) 的 每 一 个 元 守 都 由 显 式 多 
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项 式 计 算得 出 的 , 这 就 存在 潜在 的 危险 , 但 是 实际 上 ,不 微分 方程 
的 阶 通 常 是 很 低 的 , 最 常见 的 只 是 二 阶 、 三 阶 。 一 个 很 常见 的 情 
说 是 , 矩 阵 B; 是 某 个 参数 的 函数 , 并 且 对 于 此 参数 的 一 系列 值 需 
要 了 解 对 应 的 零点 的 值 的 变化 情况 。 在 $63 我 们 再 来 研究 这 个 问 
题 . 


同 接 确定 特征 多 项 式 


18. 第 三 个 课题 是 由 于 显 式 多 项 式 的 紧 凌 特性 ,全 人 想 用 

det 《4 一 z1) 的 计算 值 直接 去 确定 多 项 式 的 系数 。 如 果 计 算 了 

det( 4 一 zs1) 或 其 基 个 常数 倍 在 ws,"……, sr 上 的 值 , 多 项 式 
的 系数 就 是 下 列 方 程 组 的 解 . 

Gag? 十 cnsgp Ti+ erst oo (G1, 十 1), 

(18.1) 


其 中 凡是 计算 的 值 . 类 似 地 , 如 果 要 找 {17.1) 的 零点 ,我 们 可 以 作 
(nr 十 1) 次 计算 ,求解 多 项 式 方程 方面 已 有 大 量 的 工作 ,这 更 促 
进 人 们 把 问题 化 为 这 种 形式 。 

在 这 里 ， 我 们 的 主要 睛 的 是 证 明 这 类 方法 有 严重 的 内 存 的 局 
限 性 ,为 此 ， 我 们 描述 一 个 确定 特征 多 项 式 的 方法 ,并 且 对 于 一 种 
特定 的 零点 分 布 估计 它 的 精确 度 。 这 个 方法 是 以 我 们 能 得 到 
(〈18.1) 的 显 式 解 这 一 事实 为 基础 的 。 事 实 上 我 们 有 


LE 


csr = DB Psi, (18.2) 
后 


其 中 


PP = (—1) BD) 5 s/f I {zi — 27). (18.3) 


rn i 
我 们 可 以 自由 选择 a;。 如 果 我 们 形成 了 矩阵 的 范 数 N 的 基 种 估 
计 , 那么 在 土 N 之 闻 的 十 上 个 等 距 点 是 一 组 合理 的 值 。 采 取 这 
样 的 选择 , 可 以 对 给 定 的 ,一 次 把 Pn 确定 好 ， 这 里 未 顾及 因子 
N', 

现在 我 们 假定 矩阵 4 的 特征 值 是 1, 2,，，20, 和 矩阵 范 数 的 估 
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计 是 10。 于 是 z 的 值 是 一 10, 一 9 … 十 9。 十 10。 为 了 说 明 方 

便 , 我 们 仅 考虑 确定 ze 的 系数 , 并 且 作 最 有 利 的 假定 ， 所 有 计算 

的 如 值 其 最 大 误差 是 2-“， 表 3 给 出 因 于 P 和 值 w 的 量 级 。 
训 3 


因为 wr 一 0 (i 一 11, …, 21), 我 们 省 略 了 相应 的 PP， 根据 对 
称 性 显然 有 PP 一 P21。cs 的 真 值 是 210, 所 以 是 2: 量 级 , 但 是 
从 表 3 看 出 对 和 式 3P9w 的 贡献 是 22 最 级 因此 ,计算 cw 时 发 
生 严 重 的 相约 。 从 det(4 十 77) 的 误差 导致 的 误差 是 2 量 
级 .。 因此 。 即 使 我 们 作 了 很 有 利 的 假定 ，ce 的 误差 几乎 不 小 于 
2 分 之 一 . 在 钙 我 们 已 看 出 ,这 误差 对 于 计算 的 特征 值 的 精度 
是 致命 的 ,除非 * 十 分 大 . 

读者 会 发 现 研 究 ， 其 他 系 独 的 误差 来 考 协 这 种 特征 值 分 布 和 
好 的 其 它 特征 值 分 布 的 各 种 不 同 的 范 数 估计 产生 的 影响 都 是 很 
有 益 的 练习 ， 一 般 而 言 ,用 这 种 方法 可 能 得 到 的 结果 是 最 不 好 的 。 
许多 方面 的 改进 都 曾经 作 过 ， 特 别 是 用 Chebyshey 多 项 式 的 展 式 
拟 合 ,但 是 结果 也 不 能 令 人 满意 ， 我 们 的 分 析 证 明 , 即 使 计算 值 的 
误差 小 到 2 分 之 一 ,用 这 样 的 值 生成 的 准确 的 多 项 式 的 准确 的 零 
点 与 其 特征 值 可 能 很 不 相同 


Le Verrier 方法 


19. 一 个 独立 的 确定 特征 方程 的 方法 是 根据 如 下 事实 ，4' 的 
特征 值 是 如, 因此 4 的 迹 是 0,、 


or 一 py A (19.1) 
1=1 
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如 果 我 们 用 这 种 办 法 计算 o;， 那 么 系数 * 可 以 用 Newton 方程 
导出 : 

oa- 一 一 GT 3 

Year 一 一 (ay + agit + cerng) (19.2) 

(r=2,.*, 7). 

我 们 又 一 次 发 现 , 计算 c, 时 常常 发 生 极 严重 的 相约 ， 这 一 点 可 以 
从 对 cr 的 各 部 分 的 贡献 的 估计 来 证 明 。 例如 ,对 于 矩阵 , 其 特征 
值 是 1,2,…,20, 我 们 考虑 计算 c。: 

一 一 (ao 十 cg + + ++ e103) 20. (19.3) 
现在 我 们 知道 ，c。 是 20! 右边 的 第 一 项 是 一 sw/20, 近似 于 
一 20%/21, 它 与 6 的 符号 相反 , 约 大 2X10' 倍 。 后面 的 有 些 项 更 
大 ,因此 见 使 钙 何 ci 或 a 的 误差 只 有 2 分 之 一 ,在 计算 “的 时 候 
都 产生 很 大 的 相对 误差 . 

分 布 是 2 (i 一 1, ……，。20) 的 例子 提供 更 明显 的 说 明 . 显 
然 , 所 有 m 满足 关系 


1l<o<2, (19.4) 
co-+ 的 第 一 部 分 是 一 0,/+， 现 在 ， 后 面 的 “; 十 分 小 , 相约 一 定 很 
严重 ,甚至 计算 的 系数 连 符号 都 不 能 保证 正确 ,除非 使 用 很 高 精度 
的 运算 ， 


以 插 全 为 基础 的 选 代 法 


20. 现在 我 们 转向 确定 零点 的 方法 。 我 们 首先 考虑 内 用 1x) 
的 计算 值 , 不 用 任何 导数 值 的 方法 ， 这 些 方 靶 本 质 上 都 是 逐次 播 
值 法 (这 里 不 区 分 “内 揪 ” 和 “外 播 ”)， 这 类 方法 中 最 重要 的 一 组 是 
对 零点 的 下 一 个 近似 值 是 由 以 前 近似 值 a4，z4-4，*……, z4-, 确定 
的 , 它 是 通过 点 〈zk， 世 zt)，…，(st- f(z4-:)) 的 + 次 多 项 式 
的 零点 。 对 多 项 式 的 7 个 这 种 零点 ，xtt 取代 是 最 靠近 zi 的 那 一 
个 .如 果 我 们 取 + 为 1 或 2, 相应 的 多 项 式 是 线性 的 和 二 次 的 , 很 
容易 确定 零点 为 方便 起 见 , 记 

1#0) = fi, (20.1) 
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当 +: 1, 我们 有 
于 0 
ft 及 一 
当 z 一 2 有 一 个 十 分 方便 的 公式 , 那 是 Muller(1956) 提 出 的 .我 们 记 
各 (23) 
用 这 些 记号 容易 验证 lt+: 应 满足 二 次 方程 
0 


(20.4) 
其 中 
于 (20.5) 
由 此 我 们 得 到 
Mt 2104/ {gx 土 [gt — 4SAACA-2 一 及 -34 十 办) 全， 
(20.6) 


分 母 中 的 符号 有 待 选 定 , 要 选择 使 4444《 因 而 要 41) 的 绝对 值 比 较 
小 的 . 

显然 ,逐次 线性 插值 具有 简单 的 特点 , 但 它 有 一 个 缺点 , 这 就 
是 当 sx 和 zt-: 是 实 的 , f(x) 又 是 实 函数 ,那么 以 后 所 有 的 值 全 是 
实 的 ， 用 逐次 的 二 次 插值 ,即使 从 实 信 开 始 , 也 能 进入 复 平面 。 

如 果 取 " 大 于 2, 每 选 代 一 步 需 要 解 一 个 三 次 或 更 高 次 的 多 项 
式 方程 ， 因 此 ,使 用 三 次 或 更 高 次 插值 不 能 认为 是 合理 的 ,除非 它 
有 优越 的 收 合 性 质 (参见 $21 末 尾 .) 


渐 近 收效 率 
21. 现在 我 们 考虑 在 者 点 > 一 “的 邻 域内 最 后 的 收敛 率 。 我 
们 记 
zz 一 一 一 {21.1) 
我 们 有 
flaot w= fw+ LiFe Ll ft 
天 一 ja 二 ao) fo 十 着 + 十 
(21.2) 
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其 中 六 六,，，* 表示 在 2 一 的 导数 ;为 了 这 个 研究 的 目的 ,我 们 
用 之 表示 插值 多 项 式 . 现在 通过 点 (wis 后 ) 全 一 各 克 一 1 
一?) 的 ?次 多 项 式 给 定 为 


0 wr "1 
wk 1 
Get [fi wis wih- 1 一 0 {21.3) 


办 
有 用 (21.2) 代 人 并 按 第 一 行 展开 ,我 们 有 


一 wl) [Ln 1 fr ur- 
Hw ww) [二 wt + 
1 


Tp yi gr 2 - 
+ wr | = 


(21.4) 
这 里 在 每 个 w' 的 系数 中 ,只 包含 其 主要 项 。 当 wi 充分 小 ,所 求 的 
解 wr+s 使 得 
kt 人 《一 take wr + Fl, (21.5) 
这 个 解 的 性 质 说 明了 (21.4) 中 省 略 了 非 主 要 项 的 正确 性 的 . 
为 了 估计 渐 近 性 质 ,我 们 把 (21.5) 表 示 为 


1wkra| = Klwrffwt ee wr), (21.6) 
亦 即 
2 1 1 2 
(K’ [wanl) = (Kwal) AR’ et) eo CK wil), 
(21.7) 
这 给 出 


二 og CK) 21.8) 
从 线性 差分 方程 的 理论 知 ,(21.8) 的 解 是 
弘一 ci 好 (21.9) 
其 中 声 是 下 式 的 根 . 
H+ 二 (21.10) 
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这 个 方程 有 一 个 根 位 于 1 和 2 之 间 , 它 使 得 当 + 一 oo 时 ， 

> 2. (21.11) 
其 它 :个 根 满足 方程 wz 一 221' 十 工 一 0， 并 且 全 部 位 于 单位 
圆 内 ,这 可 通过 把 Rouché 定理 用 到 函数 


十 1 和 22 人 + (21.12) 
看 出 。 因 此 
人 Ko ~ ed. 
因而 
1 1 

Kr lwnl) ~ CK" lw )™, (21.13) 

writ ~ Ke | (21.14) 
当 了 一 1, 我们 有 


op 1 4) ~ 
KHAN, mt) ~ 162 | (21.15) 


{wirsd ~ Kwal lewds il ~ KS | ak 
当 r 一 2, 我 们 有 

Ko IF/6f|, po 1.84, 

wend ~ Kliwal warsl waals Twoanl ~ Kolwale 

(21.16) 

不 论 是 哪 一 种 情况 , 渐 近 收敛 率 都 是 很 好 的 ,但 是 大 的 K 推 迟 这 收 
敛 宰 的 开始 。 因 为 对 所 有 + 信 如 都 小 于 2, 因此 就 渐 近 收 伍 率 而 
言 ， 使 用 次 数 更 高 的 插值 多 项 式 似乎 没有 什么 道理 。 


多 重 零 点 

22. 上 一 节 的 分 析 中 ， 我 们 假定 了 f 去 0， 因 此 是 单 重 堆 
点 。 当 是 二 重 零点 ， 我 们 给 出 " 一 1 和 > 一 2 的 相应 的 分 析 。 
在 这 种 情况 下 ,我 们 有 


Lp Lp 
ra rt (22.1) 


当 r 一 1, w+， 的 线性 方程 是 
454. 


tp 全 
一 二 Fw Oo wi wt 3 Whi WR WR) = 0» 


(22.2) 
这 给 出 
Wht ~ wha CI + ws) (22.3) 
记 w 一 1/wi, (22.3) 变 为 
CAPE 二 (22.4) 
通 解 是 
Co (22.5) 
其 中 ma 和 pw 满足 方程 
pt 1, {22.6) 
因此 ,最 后 有 


wi L/w ~ lapt) ~ lal1.62)t, (22.7) 
即 到 最 后 每 一 步 误 差 被 1.62 除 。 
当 ” = 2 时 , witi 的 二 次 方程 是 
一 (ex 一 wi) (we 一 wha) (wk 一 saa) 


x 详 fw 一 站 f”" (ww 十 ipt 十 wo) 


十 二 Powaswtrawta] 一 0 (22.8} 


这 里 ,在 每 一 个 系数 中 也 是 只 包含 主要 项 ， 解 是 
whit CHF wa 2 {22.9) 
即 
wt = Klwallwed lel, 其 中 K = fl 
{22.10) 
在 本 节 的 最 后 将 说 明 这 样 做 是 合适 的 。 记 wi 一 logK1wi|， 我 们 
有 
2utt 一 丰 十 内 -十 失 -av (22.11) 
通 解 是 
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Wh = Cpt + capt + Capt (22.12) 
其 中 mm, 和 内, pe 是 方程 
2 有 一 由 十 天 十 上 (22.13) 
的 柏 。 和 上 一 节 一 样 ,我 们 可 以 证 明 ,这 个 方程 有 两 个 根 在 单位 加 
内 , 另 一 个 是 p 近似 为 1.23。 因 此 ,我 们 最 终 有 
win| ~ Kee wr) ss [F387 | wl (22.14) 
这 个 结果 是 (22.8) 中 忽略 wv 的 非 主 要 项 的 正确 性 的 事后 证 明 . 


函数 关系 的 逆 


23. 如 果 Ka) 有 一 个 单 重 办 点 = 一 a， 那么 对 于 充分 小 的 天 
z 可 以 表示 为 二 的 一 个 收敛 的 震级 数 ， 我 们 写 
# 一 g(1)， 其 中 当 f 一 0 时 ，z 一 a (23.1) 
我 们 不 用 = 的 多 项 式 逼 近 九 而 用 的 多 项 式 逼 近 s( 例 如 ， 参 见 
Osrowski (1960))。 用 了 的 二 次 多 项 式 的 研究 可 以 充分 说 明 一 般 
的 情况 。 通过 点 《zt 如 )，(zt-:。 ji ， (stay 有 -2) 的 通 近 多 项 
式 L() 可 表 为 Lagrange 形式 。 我 们 有 
OG — Fi) — fs) 
i 
GG 一 ha) 
ta Fs Fs Fi) 
(一 ff 一 AD 
+ 
Lagrange 插值 的 标准 理论 已 经 给 出 了 误差 : 


g0) — £0) = ED GF HG fd — fe), 


(23.3) 
这 里 1 是 包含 f, 及, 和 -1s 入 -1 的 区 间 内 的 某 点 ， 取 f 二 0, 我 们 
有 


”原文 混 为 &,, 一 一 评 老 注 
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一 0) 一 一 于 人 fh (23.4) 


器 此， 如果 我 们 取 kr: 为 L(0), (23.3) 的 右边 给 我 们 一 个 误差 
表达 式 。 从 (23.2) 我 们 有 
2 


Sir = LO) 一 ffimsfi-s [zor 


za 
zk 
+ Tm OU A) 23.5) 
显然 ,无 论 插值 多 项 式 的 次 数 是 多 少 ，ztt 是 唯一 的 。 此 外, 如果 
f 是 实 函数 ,迭代 从 实 值 ;开始 ,那么 全 部 送 代 值 都 是 实 的 , 这 与 
上 述 多 项 式 方 程 的 解法 相反 ， 那 些 方法 保证 能 从 实数 移 到 复 平面 
上 上， 
现在 ,我 们 有 

f= fis) 《ai 一 of(a)， 当 zs a, 《23.5) 

此 (23.4) 给 击 


Cir — oD) ~ ES FP — Oat — a — 0), 


(23.7) 
并 且 记 5 一 a 一 wis 我 们 有 
waits ~ Kwewaawess 其 中 R= 一 gC) [Fa)]/31, (23.8) 
这 是 一 个 和 (21.16) 同 样 形式 的 关系 ,并 且说 明 最 后 有 
wk ~ KP wi), (23.9) 
一 般 情况 下 , 当 我 们 用 一 个 ” 次 插值 多 项 式 时 ,我 们 有 
tw KOh Le Wes 
其 中 KK 一 一 gt 人 [了 Ca)]"(r 十 DD)!, (23.10) 
注意 ,如 果 r 一 1 这 个 方法 与 420 的 逐次 线 福 揪 值 异 等 ,和 我 们 
在 $21 看 到 的 一 样 ,无 论 * 多 大 , 与 (23.10) 相对 应 的 最 后 的 收 伍 
率 总 是 不 大 于 2 次 的 ,因此 取 * 大 于 2 没有 好 处 ， 
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如 果 “ 是 = 重 零点 ,那么 我 们 有 
1 一 co 人 sz 一 zj 十 cotts 一 on 十 (23.11) 
并 且 * 一 a 可 以 表示 为 几 " 的 等 级 数 。 豆 然 ,在 这 种 情况 下 , 播 值 
是 不 能 令 人 满意 的 。 
从 我 们 的 经 验 君 来 ,对 于 特征 值 河 题 ,本 节 的 方法 不 如 前 一 节 
的 方法 好 ,( 另 一 方面 ,对 于 精确 地 确定 Bessel 函数 的 零点 , 从 好 
的 近似 售 开 始 , 它们 是 很 好 的 方法 . ) 因 此 ,在 526 的 比较 中 我 们 不 
讨论 这 一 节 的 方法 . 


区 站 分 半 法 


24. 关于 用 函数 值 的 方法 ， 我 们 再 提 一 个 区 间 分 半 鞭 来 结束 
有 关 讨 论 , 在 第 五 章 研究 对 称 三 对 角 短 阵 的 特征 值 时 ,我 们 已 讨论 
过 这 个 方法 ,显然 , 它 可 用 于 寻找 一 般 实 函数 的 实 零 点 。 使 用 这 个 
方法 之 前 必须 用 另外 的 手段 确定 两 个 值 a, 5 使 得 1(4) 与 15) 的 
符号 相反 ,一 旦 这 样 的 a,6 找到 , 便 可 用 多 步 在 宽度 为 (2 一 2)/2 
的 区 间 内 确定 一 个 零点 ， 这 个 方法 没有 收敛 狂 河 题 。 


Newton 法 


25，521 一 $23 的 分 析 只 涉及 最 终 的 收敛 率 ， 并 且 只 详细 讨论 
了 一 重 或 二 重 零点 的 情况 。 此 外 ， 也 没有 把 合 人 误差 计算 在 内 . 
通常 我 们 不 能 从 很 知 近 零点 的 值 开始 和 迭代， 并 且 总 要 受到 舍 人 误 
差 的 影响 。 在 讨论 过 别 的 迭代 靶 以后， 我 们 再 在 59 ~$60 和 
§35~§47 讨论 这 些 问 题 . 

现在 我 们 转向 既 用 函数 值 又 用 导数 值 的 方法 。 Newton 法 是 
其 中 最 熟识 的 方法 ， 这 个 方法 中 第 十 1 个 近似 值 与 第 下 个 近似 
值 的 关系 是 

She ge FCsa) /F(z) (25.1) 

在 单 重 零 点 # 一 a 的 邻 域内 我 们 可 以 写 
ws—e, f=—fw+o) fwt pi + (25.2) 
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其 中 导数 是 在 点 一“ 处 计算 ， 因此, 我们 有 


1 1 
ok 十 互 je 十 吉 jo 十 


WHHL WO (25.3) 
f+ fwe+ 去 ao 十 
1 ，。 1 
prop pow + ee 
ta 025.4) 
P+ fw wat 
这 给 出 
wer ~ (FI2F) wR (Ff 0). (25.5) 


对 于 二 重 零点 我 们 有 了 一 0， 妨 学 0， 因此 ,从 (25.3) 得 到 


1 fe 3 
Fp 


wn 一 地 wx 十 Pr (25.6) 
这 给 出 
wa (25.7) 
类 似 地 ,对 ” 重 的 零点 ,我 们 可 证 明 
wn ~ (1 — 1/r)w, 《25.8) 


结果 收敛 速度 随 着 重 数 增加 而 逐渐 减 慢 。 显然 ,对 于 > 重 零点 ,每 
一 步 的 修正 量 由 于 有 因子 1/r 就 显得 太 小 了 . 因此 ,对 这 种 零点 
我 们 建议 代替 (25.1), 使 用 


zat = a rf) /flan). (25.9) 
事实 上 ,(25.9) 给 出 
wa ~ 元 wo (25.10) 


可 楷 ， 我 们 通常 不 能 预先 知道 零点 的 重 数 。 


Newton 法 与 播 值 法 的 比较 
26, 对 于 每 一 种 压缩 型 抵 阵 ， 计 算 一 阶 导数 的 工作 是 大 约 和 
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计算 函数 本 身 的 工作 量 相等 。 如 昌 和 矩 阵 的 阶 数 适当 , 我 们 可 以 假 
定 线性 插值 ,二 次 插值 或 Newton 法 做 一 步 的 工作 量 与 函数 计算 。 
导数 计算 所 需 的 工作 量 相 比 是 可 以 忽 赂 不 计 的 . 

在 以 上 的 假设 下 ， 用 线性 插值 或 二 次 插值 的 两 步 与 Newton 
法 的 一 步 作 比较 是 恰当 的 ,对 于 线性 插值 的 两 步 ,在 单 重 零点 邻 域 
内 由 (21.15) 我 们 有 
win CR ee 其 中 K = ff28, (26.1) 
市 对 于 Newton 法 有 


wir ~ Kw (26.2) 
其 中 下 的 值 是 相沿 的。 显然 ,线性 插值 的 渐 近 收敛 率 高 。 

在 二 重 零点 的 邻 域内 ,线性 插值 的 两 步 给 出 

Wr2 ~ wf 162) ~ wif2.62, (26.3) 

这 也 说 明 播 值 比 Newton 法 好 . Newton 法 也 有 线性 插值 有 的 那 
种 缺点 , 即 如 果 f(x) 是 实 荡 数 ,计算 从 实 什 开始， 那么 所 有 的 
值 都 是 实 的 ,用 这 方法 不 能 确定 复 的 零点 . 

在 这 种 比较 中 ,逐次 二 次 插值 更 显得 优越 。 对 单 重 零点 ,二 次 
插值 的 两 步 给 出 


Total 一 区 wk， 其 中 KK 一 | 一 J6f1。 (26.4) 
而 对 于 二 重 零 点 两 步 的 结果 有 
Tt ~ 民 wtl 5 其 中 六 一 | 一 六 7138，《〈25.5) 


上 上述 比较 是 假定 函数 计算 和 导数 计算 的 工作 量 差不多 ,对 于 
一 般 矩 阵 来 说 ,这 个 假定 是 不 成 立 的 ,事实 上 导数 的 计算 量 比 函 数 
det(4 一 5T) 的 计算 量 大 得 多 ， 关 于 广义 特征 值 ,相应 的 函数 是 
det(Ass’ + Aris 十 二 
所 作 的 假定 更 不 成 立 。 对 这 类 问题 比较 更 有 利于 插值 法 。 


三 次 收效 的 方法 


27 假如 我 们 计算 适当 的 各 阶 导 数 ， 就 可 以 推导 出 任何 指定 
阶 数 的 渐 近 收敛 的 方法 . 一 个 简单 的 推导 方法 是 用 Taylor 级 数 
展开 , 然后 移 项 。 我 们 有 
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fz + A) = fa) 十 好 (za 十 2 p's4) + OC), 


《27.1) 
如 果 选 取 使 得 f(z4 十 4) 一 0， 我们 有 
ma she 一 人 /Cs — PCa) /2F (a) + OP) 
~—fsO/ a0) — [fa Pe) /207 (a), 
(27.2) 
容易 验证 ,这 式 子 给 出 三 次 收敛 性 。 这 个 公式 似乎 没有 被 采用 。 


Laguerre 方法 


28. Lagnerre 提出 了 一 个 更 有 趣 方 法 ,在 单 零 点 的 邻 域 中 也 给 
册 三 次 收敛 性 他 是 在 研究 只 有 实 替 点 的 多 项 式 时 提出 这 方法 
的 ,其 基本 思想 如 下 , 

设 f(x) 有 实 零点 4 过 b 之 .… << le。 又 设 * 雍 在 1。 和 
n+l 之 间 ， 当 x 效 在 区 得 〈1。 4。》 之 外 时 , 我 们 可 以 认为 , 实 轴 
从 一 o 到 十 ce 是 相连 的 , 即 * 在 2, 和 之 间 . 现在 我 们 考虑 对 任 
何 实 的 x 由 下 式 定义 的 X 的 二 次 多 项 式 g(X). 


sO) = Ce — x7 {De x 


{28.1) 
显然 , 当 # 到 x*, 我 们 有 
8 >0 0 一 1 ,0), gr) < 0. (28.2) 
此 ， 对 于 任何 实 的 x 关 *， 函 数 g(x) 有 两 个 零点 X'(w) 和 
X”(w)， 并 且 使 得 


ln SR xR" ne (28.3) 
(在 * 位 于 区 间 《2 4。) 之 外 的 情况 ， 有 一 个 X' 位 于 4。 和 x 之 
闻 , X” 位 于 * 和 14, 之 闻 ,) 我 们 可 以 认为 ，X” 和 X” 是 比 x 本 身 
更 好 的 * 相 邻 的 两 个 零点 的 近似 值 。 现在 , 我 们 考虑 对 所 有 实 的 
x# 取 的 X' 的 极 小 值 和 XxX” 的 极 大 值 。 这 极 小 值 和 极 大 值 一 般 是 
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在 不 同 的 * 传达 到 。 在 极 信 点 我 人 有 8 一 0 一 


如 果 我 们 写 g(X) 志 4 志 十 2Bu 十 C,4,B,C 是 X 的 函数 , 那 
么 对 于 零点 的 极 值 ,我 们 有 
BRK, mr 04.. 68 asc_ 
24x 十 28 一 0 (因为 0, RH 路 
(28.4) 
这 给 出 B” 一 4C。 用 代数 理论 容易 验证 判别 式 为 零 必定 给 出 极 
值 


注意 到 
FI Bl(x — 0) = Es (28.5) 
GIP FID) Bl/(s — Hh ~ B, 《28.6) 
下 布 


Ef lx 一 2 一 x2 一 卫 ， 
作 少 最 代数 运算 后 我 们 可 以 看 出 ，B? 一 4C 简化 为 
n—2B(x*— KX)+ [Fn—1)3](r 一 7 一 0 (28.7) 
相应 地 ，Lagacrre 给 出 了 两 个 慎 
X= 


Br — 1m 
+ 一 全 

了 士 [Ca 一 1)(F) a(n — DT? 
其 中 一 个 比较 接近 1。， 另 一 个 接近 4%4s。 虽 然 上 述 办 想 仅 适 用 于 
只 有 实 零 点 的 多 项 式 ,但 是 我 们 立刻 可 以 把 它 推广 到 复 平面 上 ,给 
出 迭代 过 程 : 


(28.8) 


Pe 
其 中 
下 = 一 DA 一 ae 一 DR (89) 
这 式 意味 着 在 单 重 雪 点 4 的 令 直 内 ,如 果 我 们 办 了 符号 分 的 
和 对 信 入 本 ,那么 


462。 


se), 


(28.10) 
其 中 


B= Ds — 4, B= > 1 — bh). 
i fm 


{28.11) 
因此 ,过 程 在 单 重 夫 点 的 人 城内 是 三 次 收 久 的 。 有关 思 的 是 ,在 验 
证 三 次 收 俩 性 时 没有 利用 这 样 的 事实 ， 即 在 (28.9) 中 和 以 同 
样 的 地 位 出现 ,并 且 对 于 任何 * 信 过 程 是 三 次 收 人 的 。 
另 一 方面 ,如 果 le 是 > 重 夫 点, 我们 可 以 验证 (28.9) 意 味 着 
rt ho ~ Cr Dl bm)/fr + [Cr — Dr/ls — 7)#}. 
(28.12) 
这 使 得 收 全 仅仅 线性 的 . 
修改 (28.9) 使 过 程 在 重 堆 点 的 名 城内 达到 三 次 收 健 是 容易 
的 一 个 合理 的 公式 是 
| 


站 


(28.13) 

当 + 二 1, 公式 简化 为 (28.9)。 可 惜 要 从 这 个 公式 得 到 收益 , 必须 
要 识别 正在 计算 的 零点 的 重 数 . 

显然 , 当 所 有 零点 都 是 实 的 时 ,如果 《28.9) 中 选取 固定 的 符 
号 , 它 将 给 出 一 个 单调 序列 ,这 序列 趋向 于 与 相 令 两 个 零点 中 的 一 
个 . 对 于 有 复 零点 的 多 项 式 没有 类 似 的 结果 。 

假如 态 的 计算 量 与 f, 了 的 差不多 ,这 些 三 次 收敛 的 方法 的 两 
步 应 该 和 Newton 法 的 三 步 相 比 。 对 三 次 收敛 方法 的 两 步 有 


wha ~ A 《28.14) 
而 对 Newton 方法 的 三 步 有 
kt ~ Be. (28.15) 


因此 ,以 渐 近 收 敏 性 而 论 ，Newton 法 较 差 ， 
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复 夫 点 


29. 直到 现在 为 止 我 们 只 是 顺便 提 到 了 复 零点 。 我 们 讨论 过 
的 大 多 数 方法 ,计算 fCz) 和 它 的 导数 的 以 及 计算 零点 的 , 都 可 以 
立刻 搬 到 复 短 隆 的 复 特征 值 的 计算 .我们 只 须 把 实数 运算 改 为 复 
数 运算 . 因为 -个 复数 莱 法 包含 四 个 实数 乘法 ,因此 在 复数 情况 ， 
计算 量 增 大 至 实数 情况 的 四 售 。 

可 是 ,实际 上 , 复 和 矩阵 是 比较 少见 的 ,更 多 的 情况 是 实 矩 阵 ,但 
有 一 些 共 邢 的 复 特征 值 。 自然, 我 们 可 以 用 揽 矩 阵 的 办 法 来 处 理 
它 , 但 是 我 们 预料 能 利用 它 的 特点 碱 少 计算 量 . 

首先 ,我 们 要 注意 , 我 们 确定 一 个 复 零 点 , 那么 其 共 辑 复 数 也 
是 一 个 堆 点 ， 因此 ， 只 要 在 一 个 复 迁 代 中 工作 量 不 多 于 一 次 实 的 
迭代 的 两 倍 ， 那 么 我 们 可 以 用 找 两 个 实 替 点 同样 的 时 间 找 到 一 对 
复 共 元 零点 。 

如 果 我 们 用 氮 赛 乘法 ( 郊 52), 对 复 的 = 值 计算 显 式 多 项 式 的 
值 ,那么 每 一 个 5 值 ,除了 ss 之 外 都 是 复 的 。 每 一 步 都 包含 真正 的 
复数 乘法 . 因此 ,一 次 计算 有 四 倍 的 工作 量 , 并且 不 能 利用 4, 是 实 
数 的 特点 来 减少 工作 县 .在 下 一 节 我 们 说 明 如 何 去 克 服 这 一 缺点 。 

关于 实 三 对 角 矩 阵 ( 见 $8), 记 


= pls) = 5(2) + (2), (29.1) 
方程 (8.2) 变 为 
人 2 一 (or 一 z)o-ie) 十 ysls) 一 Bra)， (29.2) 
He 一 (or 一 20-i(s) 一 JiaKe) — Brrr a la)s 
在 实 的 情况 要 两 个 乘法 的 而 在 这 里 要 6 个 乘法 。 
关于 Hessenberg 和 矩阵 ( 见 $11) 记 
i (29.3) 


方程 (11.5) 变 为 
{ 十 《er 一 xjar 十 grit 十 十 woota 填 yo 一 0 


Gr0rt tt (am — x)or tt Gnesi t + trave — yu — 0, 
{29.4) 
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除了 附加 的 yv, 和 一 yu, 项 之 外 , 需要 的 是 两 倍 的 计算 量 ， 同 样 
的 评论 适用 于 求 导 后 的 方程 (11.7)， 因 而 在 这 种 情况 下 ,我们 找 
一 对 复 共 粥 堆 点 的 效率 大 致 与 找 两 个 实 零 点 的 效率 相同 ， 并 且 不 
必 对 过 程 作 修正 . 

39. 可 能 设想 $12, $513 的 误差 分 析 不 能 用 到 复 的 情况 ， 因 为 
在 (29.4) 中 的 每 一 个 方程 独立 地 确定 每 一 个 等 价 a 中 的 等 价 摄 
动 , 并 且 一 般 说 来 它们 是 不 同 的 。 不 过 , 这 个 异议 只 是 一 个 错觉 ， 
并 且 在 每 一 个 ce 上 容许 复 的 摄 动 ， 这 个 问题 就 得 到 小 清 。 为 了 
如 免 多 重 下 标 ， 我 们 集中 考虑 一 个 特定 的 元 素 mr， 并 且 假 定 在 
(29.4) 的 第 一 、 二 个 方程 中 和 舍 人 误差 对 应 的 等 价 摄 动 分 别 是 
ane! 和 err6z。 我 们 希望 证 明 存 在 适当 的 mm 和 加 使 得 

arqne tim) (ut 和 p 0) 一 arpagi 十 ianpigl。 【30.1) 

显然 我 们 有 


{P+ Bw + v7) = et + vid, {30.2) 
这 给 出 
而 十 形 安 可 十 如 {30.3) 
可 以 证 明 ， 我 们 对 于 浮 点 实数 运算 给 出 的 误差 界 不 必 作 本 质 性 的 
修改 即 可 用 于 复 的 运算 上 。 对 应 的 结果 是 
f(zits) 二 《十 罗 )(1 十 6), jal 2 
Hasa) = gl + 61), sl 天 2 232， (30.4) 
Hs/s) = a(l + 3)/r, je 一 5 24274, 
现在 , si 通常 是 复 的 。 在 这 些 结果 中 ， 我 们 已 假定 在 这 些 复数 计 
算 涉 及 的 实 运算 中 的 伟人 误差 是 第 三 章 讨论 过 的 类 型 ， 这 些 结 果 
的 证 明 留 作 练 习 。 


复 共 回 零点 


31, 现在 我 们 证 明 , 可 以 用 25 个 乘法 的 工作 量 完 成 一 个 复 变 
量 的 实 系数 多 项 式 计算 .首先 , 我 们 注意 用 * 一 & 除 f(z) 的 剩 
余 是 i(o). 这 意味 着 我 们 能 从 一 pz 一 上 除 f(x) 的 剩余 得 到 
fa 十 夫 )， 其 中 
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[s— (et iB)ls — (oe—i8)] = pl, (31.1) 
事实 上 ,如 果 


f= pr (31.2) 
那么 
flu t+ 18) = (re ts) + i(rB), {31.3) 
如 果 我 们 写 
f(s) 一 ons 十 adn-ss" 十 二 (31.4) 


3(z) 一 gas" 二 ges" 二 + 十 
那么 利用 (31.2) 两 边 “的 者 相等 ,重新 整理 各 项 我 们 有 
gr = ds dri™ en-l Pqr, 
at pgmnt lg (no 2, ,2), (31.5) 
r=at pot lg | ot lg7, 
这 些 方程 可 以 逐次 确定 qs, 49a-1，*…, 1， 7， fs。 注意， 如 果 我 们 
继续 递 推 下 去 ,就 得 到 
qi = a + pqs + lqss (31.6) 
go = 0+ pg + lg (31.7) 


那么 

7 一 4 和 :一 4 一 85 一 有 (比如 说 ). (31.8) 
写 (31.2) 为 下 式 比较 方便 ， 

1(2) = (#2 ~ pr — I)g(s) + ge + go, (31.9) 
根据 递 推 关系 和 (31.3), 我 们 可 以 用 大 约 2 个 实习 法 计算 f(a 十 
而 ) 的 值 。 

32 类 似 的 方法 可 以 用 来 计算 了 (a 十 刘 ). 为 此 ,我 们 首先 用 
加 一 pr 一! 除 9(z)。 如 果 我 们 写 

ga) = (x FD)T) + Ts + To, (32.1) 

了 (se) TT (32.2》 
那么 我 们 用 类 似 的 论证 可 得 

了 -一 gay Tes 一 Gai 士 PTs-z, 
T= gmt pron t iT (Gn—4,..°,0), (32.3) 
Tum To ~ PT, 
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如 果 两 组 递 推 关 系 同步 进行 ,中 间 量 9, 就 不 用 保存 。 对 (31.9) 求 
导 , 我 们 得 
f(s) = (2 ~ ps — il)g(e) 十 (2z — p)gle) + gr, (32.4) 


fst if) ~ (2 + 2i8 —p)g(a Tt ip) + qu (32.5) 
从 (32.1) 我 们 得 到 
got ip) = Ta + Tt iTh. (32.6) 
回顾 2 一 p, 我 们 有 
flot iB) = 2i(Ta t Ts + iT,8) + gq 《32.7) 


类 似 地 ,我 们 如 果 用 有 * 一 pz 一 ! 除了 Cs) 可 以 得 到 f(a 十 ;6)， 
其 它 可 依 此 类 推 。 


Bairstow 方法 


33. 上 一 节 我 们 介绍 了 用 * 一 一 上 作 除法 ， 这 是 作为 对 
复 变量 计算 1(x) 的 手段 。 4 的 递 推 关系 使 我 们 能 计算 f(z) 在 
台 一 px 一 1 的 零点 ma 和 上 的 和 值 , 不 管 它们 是 复 共 槐 对 或 是 实 的 
零点 

在 Bairstow 方法 (1914) 中 , 我 们 直接 对 (x) 的 实 的 二 次 因 
子 迭 代 . 《31.9) 分 别 关于 心 p 区 各 导 玫 我 们 有 


0——g + (ps—D) 2 癌 *O+ 如 :+ 好， 


{33.1) 


0 gO) + Fp) a + 
Op Op Bp 


(33.2) 
此 两 式 又 可 写 为 
Ba 士 如 二 qls) mod(z’ — ps 一 让， (33.3) 
Ba s+ ds sg) modtz — ps — i). (33.4) 
Bp Op 


因此 ,从 (32.1) 我 们 得 到 
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如 十 如 二 和 (33.5) 


et = T+ 0 

= spT 70) + TL {33.6) 
现在 用 Newton 法 去 改善 一 个 近似 的 qz 十 多 的 零点 ,我 们 选择 
3p 和 1 使 得 对 所 有 ?有 


(qe 二 科 十 让 (gr 二 的 如 十 训 (41r 十 38 一 0 
p a 


《33.7) 
因此 
q+ (pT TOP + Tl = 0: (33.8) 
gs + TBP + TB! = 0, (33.9) 
上 述 方程 的 解 可 表示 为 
Dap 一 Tig 一 Toq, D3l = Mg — Togo, (33.10) 


其 中 玉 一 iT -+ pTo D= Ti 一 MT. 
因为 (33.7) 中 已 略 去 57, pp51。 6” 和 更 高 次 的 项 , 因此 ， 这 个 方 
法 对 于 二 次 因子 给 出 了 二 次 收 化 性 。 即 使 方法 收 全 于 有 复 零点 的 
因子 ，Bairstow 与 Newton 法 也 不 相同 。 特 别 是 如 果 方 法 用 
于 二 次 多 项 式 ， 那 么 从 任何 初 值 开 始 只 要 一 次 迭代 就 收敛 于 正确 
的 因子 。Newton 法 只 给 出 二 次 收敛 性 。 


广义 的 Bairstow 方法 


34。Bairstow 方法 通常 是 针对 显 式 多 项 式 来 讨论 的 ,但 是 这 个 
方法 可 应 用 于 以 任何 形式 出 现 的 多 项 式 ， 只 要 能 计算 连续 两 次 用 
了 一 pz 一 上 作 除 法 的 剩余 . 

对 于 三 对 角 甜 隆 ，(4 一 z1) 的 前 主子 式 被 一 pz 一 1 除 
所 得 的 剩余 有 一 个 简单 的 递 推 关 系 。 如 果 我 们 写 


* 原文 误 为 31, 一 一 译 者 注 
468。 


prla) = (7 ~— pz — 1)g(s) + Azs+ B,» 
G2) = (a — pz— DT) +t C+D, 
那么 在 关系 式 
pra) 一 《cr 一 =) -ai(z) — Prip,alz) (34.2) 
中 ,我 们 把 (34.1) 第 一 式 代 人 , 并 利用 * 一 px 一 1 的 系数 相等 得 
到 


(34.1) 


do] 一 (or — 3)9, 1%) — Pigr2(8) 一 如- (34.3) 


类 似 地 ， 
了 ,as) 一 (cr 一 IT 2) — Pr,T az) 一 Ci (34.4) 

这 些 方程 给 出 

如 一 (四 一 4- 一 Byrd 一 了 

B, 一 arB ny — Bi7rB — As, 

C= (0 — PC — BriCrs — Ds, 

D, 一 a,D, — pr Da — Cr — A 
因为 po(2) 一 1，g(z) 一 0, pC2) = 一 +，9s(2) 一 0， 我 们 
有 


(34.5) 


A 0, Bo=1, A4=—i, Bw os 
CD C=D,=0, 
注意 ，(34.5) 的 前 两 个 式 子 使 我 们 能 用 5r 个 乘法 计算 p, (a 
十 廊 ), 而 用 (29.2) 要 6n 个 乘法 .其 中 量 4。， B。。 Cs, D 分 别 是 
上 一 节 的 qs gs Ts To 
A 是 上 Hesseaberg 型 时 对 (4 一 s1) 的 前 主子 式 我 们 可 以 
得 到 对 应 的 关系 式 ,为 了 简化 记号 ,我 们 假定 下 次 对 角 线 元 素 都 是 
1. 于 是 我 们 有 
入 Ca) 一 (ar 一 3]p -Ka 一 ar-nrprao 
+ nap + + 1) apole), (34.7) 
其 中 如 (mm 一 1 
和 (34.1) 一 样 ,定义 qr(z)。4r Bi CD 则 qz) 满足 关 


(34.6) 


系 
Gr(2) = (qm 一 5)9 102) 一 ar1rgral) 
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十 or-zogr-aKs) + 十 《一 1 engofe) — A 


(34.8) 
而 4,，B,, C,, D, 满足 关系 
A = am — PA arid rnprAes t+ 
十 【一 Ido — Bs 
五, 一 gr 有 一 Gy -or 了 3 十 ay ay 了 3 十 … 
十 《一 1 avBe ~ lA, 
Cr (om — PC omCra tt arr Crst ee 
十 《一 DerCo 一 Dis 
D, 一 arPD — or-orD + er-arD 十 
+ (—1) aD 一 5C 一 4 
(34.9) 
其 中 
4 0, Beml, A —!1, Bl™ a (34.10) 


C=D Cm D = 0, 
每 一 次 迭代 约 需 要 2m 个 乘法 。 
Handscomb (1962》 兽 给 出 一 个 稍稍 不 同 的 递 推 公式 . 


实际 的 考 感 


35. 直到 现在 ,我 们 讨论 迭代 法 时 还 没有 考 注 到 数值 计算 的 
限制 。 通常 仅 当 计算 的 特征 值 有 许多 有 效 数字 时 , 我 们 讨论 的 收 
敛 性 的 渐 近 性 质 才 是 真实 的 。 实际 上 ,我 们 很 少 需 训 10 位 以 上 正 
确 的 十 进位 有 效 数字 ， 虽 然 我 们 可 以 用 很 高 的 精度 的 运算 来 得 到 
它 . 

表达 方法 具有 二 次 或 三 次 的 收敛 性 的 一 个 普通 的 说 法 ，“ 最 
后 每 一 次 迭代 数字 位 增 到 二 倍 或 三 倍 .” 这 样 的 论述 不 妨 由 “ 古 
典 ” 的 分 析 来 做 ， 但 是 在 实际 的 数值 分 析 领 域 中 是 不 合适 的 ， 例 
如 ,假定 用 一 个 三 次 收敛 的 方法 ,最 后 ,误差 w; 的 性 质 由 下 式 表 示 

wi ~ 10%wa,. (35.1) 
如 果 我 们 取 wi 一 10 那么 假定 上 述 渐 近 关 系 当 wi 一 10” 时 
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成 立 , 我 们 就 有 
watt 1075。， 3 se 1074, wiss 1079. (35.2) 
实际 上 ,我 们 不 能 期 望 有 wk 一 10-”， 除非 我 们 的 函数 值 有 多 于 
29 位 十 进位 ， 和 迭代 很 可 能 到 wi 为 止 , 如 果 继 续 到 wktta 大 入 精 
度 就 限制 在 计算 用 的 位 数 。 即使 Kz) 和 它 的 导数 的 计算 信 准 确 
到 运算 精度 ， 上 述 看 法 还 是 正确 的 。 我 们 发 现 wx 的 值 一 旦 达到 
充分 小 , 渐 近 性 质 起 作用 时 ,计算 用 的 位 数 就 限制 了 我 们 利用 渐 近 
收敛 性 的 能 力 ， 
在 零点 的 邻 域 内 计算 的 f(z) 的 水 平 又 进一步 限制 着 结果 可 
能 达到 的 精度 。 考察 一 下 我 们 所 给 的 公式 就 扬 示 了 这 样 的 事实 ， 
即 在 每 一 种 情况 下 "修正 量 ”zkrt 一 x4 总 是 与 计算 值 人 #4) 直接 
成 比例 的 。 因 此 ,除非 Kx) 有 一 些 正确 的 有 效 数字 位 , 否则 计算 
的 修正 重 与 真正 的 修正 量 相 差 很 远 。 


会 人 误差 对 渐 近 收敛 性 的 彩 响 


36. 对 于 每 一 种 特殊 型 第 阵 ， 我 们 已 找到 4 的 摄 动 54 的 界 ， 
这 个 摄 动 与 计算 det(4 一 z1) 时 产生 的 误差 等 价 。 jj54ls 的 界 
总 是 与 2” 成 比例 的 ， 因 此 可 以 用 足够 高 的 精度 运算 使 报 动 尽 可 
能 小 。 必须 着 重 指出 54 与 z 及 计算 det(4 一 x1) 的 算法 有 关 ， 

如 果 用 4 表示 4 的 特征 信 , 4 表示 (4 十 84) 的 特征 值 , 那 
么 由 特征 值 的 连续 性 得 知 , 4; 适当 排 号 后 有 

0 一 入 ， 当 5 一 > oo。 

可 是 ,除非 * 充分 大 ,否则 《4 十 54) 的 特征 值 与 4 的 可 能 毫 无 共 
局 之 处 ， 特征 值 为 1, 2，…，20 的 Frobenius 型 提供 了 这 样 的 例 
子 .我 们 已 看 到 (方程 (5.3)), 除 非 2… 比 10 小， 否则 摄 动 后 矩 
阵 的 特征 值 简直 不 能 认为 是 原 矩 阵 的 特征 值 的 近似值 。 


区 向 分 半 法 


37. 我 们 首先 考虑 用 区 间 分 半 法 确定 实 矩 阵 的 实 的 单 重 特征 
值 所 受到 的 限制 ,假定 我 们 已 经 确定 两 点 < 和 5。，det(4 一 x1) 在 
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这 两 点 上 的 计算 值 符 号 相反 。 对 于 一 个 指定 的 实 值 > 计算 
det(4 一 *1)， 我 们 得 到 det(4 十 54 一 z1), 其 中 84 是 实 的 ， 
并 且 


det(4 十 534 一 27) 一 二 (4 CO— #2), (37.1) 
5 


对 于 每 一 个 压缩 型 我 们 已 经 给 出 54 的 界 ， 并 且 对 任何 多 许 的 
54， 对 应 的 每 一 个 都 沙 在 包 合 2 的 连通 区 域内 。 我 们 可 以 称 
这 个 区 域 为 % 的 不 确定 区 境 。 注意 ， 这 个 区 域 与 * 及 计算 
det( 4 一 #1) 值 的 算法 有 关 ， 假 定 : 充分 大 到 使 得 包含 ly 的 区 域 
与 别 的 区 域 分 离 ， 在 这 种 情况 下 ,当然 所 有 1 必定 是 实 的 。 并 且 
包含 1 的 区 域 是 实 胃 上 的 一 个 区 间 . 

图 1 展示 了 一 个 典型 的 情况 。 要 研究 的 特征 值 是 1 它 对 所 

有 满足 有 关 界 的 振动 4 保持 为 实数 ,其 他 的 特征 值 性 态 如 下 . 
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4 是 二 重 特征 入 ,对 某 个 54,4 变 为 复 共 饭 对 . 

和 14 是 很 靠近 的 特征 值 , 对 某 个 84 它们 变 为 复 共 孝 对、 

4 和 为 是 实 的 特征 值 , 并 且 保持 为 实 的 ， 

加 和 加 是 复 共 e 对 , 并 且 保 持 为 复 共 犯 对 , 包含 1; 的 区 域 的 
直径 是 它 的 条 件 的 度量 ， 

现在 ,如 果 计 算 det( 4 一 z1) 在 点 ,bs 上 的 值 , 我 们 得 到 一 
个 正 的 和 一 个 负 的 值 ,而 与 4 在 它 的 区 域内 的 位 置 无 关 ， 如 果 我 
们 反复 地 把 区 间 分 半 ， 那 么 对 于 任何 不 属于 包含 js 的 区 域 的 分 
点 ,我 们 必定 得 到 det(4 一 z7) 的 正确 的 符号 .因此 ,和 第 五 章 541 
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完全 一 样 , 我 们 可 以 证 明 , 或 者 是 所 有 的 分 半 区 间 真 正 包含 1,, 或 
者 是 以 某 阶段 起 至 少 有 一 个 分 半 区 间 端 点 属于 包含 2 的 区 域 . 如 
果 这 个 区 域 是 区 间 〈? 一 x, 4; 十 y), 那么 显然 在 不 步 分 半 之 后 ， 
最 终 的 分 半 区 闻 的 中 点 属于 区 间 

[hp—z—2 tMb— a), d+ y+ 2 ts — a)l, (37.2) 
为 我 们 愿意 用 多 少 步 就 能 用 多 少 步 ， 因 此 这 个 方法 最 终 受 区 间 
《5 一 x 加 十 的 大 小 约束 . 

值得 注意 的 是 ， 我 们 一 般 不 能 期 望 小 特征 值 的 计算 值 丰 对 误 
差 小 ， 也 没有 理由 期 望 包含 小 零点 的 区 域 会 比 包含 大 零点 的 区 域 
小 . 一 般 说 来 ,我 们 能 期 望 的 最 好 结果 是 当 特 征 值 是 良 态 时 ,相应 
的 区 域 是 2 -4|z 数量 级 的 。 


逐次 线性 插值 


38, 区 闻 分 半 法 不 存在 收敛 性 河 题 ， 并 且 可 以 认为 这 方法 之 
所 凡 成 功 全 在 于 它 不 是 利用 函数 值 的 数值 。 例如 ， 如 果 分 半点 
= 正好 落 在 包含 特征 值 1* 的 区 域 之 外 , 那么 计算 的 det(4 一 21) 
的 符号 必定 是 正确 的 ， 但 是 它 的 相对 误差 可 以 任意 大 ， 这 可 以 由 
(37.1) 及 六 可 以 在 4 的 区 域内 任何 地 方 这 一 事实 看 出 。 
另 一 方面 ,如 果 我 们 用 逐次 线性 插值 ,我 们 有 
2 一 Skt far O— sia) CF — fi). (38.1) 
初 看 起 来 ， 和 的 相对 误差 大 是 严重 的 问题 。 可 是 这 只 是 一 个 错 
觉 。 如 果 计算 的 精度 使 得 能 确定 特征 值 1* 达到 合理 的 精度 , 那么 
当 剑 接近 加 的 区 域 时 , si 和 ww-: 是 在 az 的 同一 侧 , 并 且 从 $21 
知 ，1z4 一 4ol 比 124-1 一 4e| 小 得 多 ， 如 果 允 和 47 分别 是 与 
在 xx 和 zs-: 计算 对 应 的 摄 动 后 矩阵 (4 十 854) 的 特征 值 ,我 们 有 


sat (um) Gm/ 


区 (Wm) 二 一 sg] 
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Sat CW sp — wi) EO — aa) — (ho — za)]s 
(38.2) 
因为 
Um 人 天 )。 (38.3) 
关系 式 (38.2) 可 以 表示 为 如 下 形式 ， 
» 了 2 一 好 
au 二 (一 so + .38.0 
这 表明 +4 十 分 舍 近 1 。 通常 ，xt+: 的 精度 比 准确 计算 得 到 的 低 
得 多 ， 如 同 (21.15) 所 示 . 准 确 计算 使 得 ht+: 一 ae 是 (zt 一 29)， 
(#4-; 一 at) 的 数量 级 。 尽管 这 样 ,我 们 的 论证 说 明 ， 直 到 我 们 
得 到 的 秆 属于 不 确定 区 域 前 , 淆 代入 一 直 在 改进 ,即使 用 区 间 分 半 
法 也 不 能 得 到 更 好 的 结果 . 

达到 不 确定 区 域 后 ， 情 况 就 不 令 人 满意 了 。 了 的 计算 值 几 乎 
准确 地 与 x 一 和 # 成 比例 并 且 叉 随 中 变化 ， 因 此， 对 于 在 不 确 
定 区 域内 的 zx，det(4 一 zi1) 的 计算 值 随 闭 舍 人 误差 的 变化 而 
起 伏 波动 ,而 对 任何 这 祥 的 sx“ 期望" 值 却 基本 上 是 个 常数 ， 在 47 
的 表 2 中 对 此 有 很 好 的 说 明 , 玫 中 前 五 个 x 值 都 落 在 包围 2 一 10 
的 不 确定 区 域内 。 尽 管 第 五 个 值 与 零点 的 距离 是 第 一 个 值 与 等 点 
的 距离 的 2 倍 , 但 所 有 计算 的 函数 值 都 是 同 祥 的 数量 级 ， 现 在 ， 
从 (38.1) 式 我 们 看 出 ,一 次 迭代 得 到 的 修正 量 是 

《ak 一 s/f — A)], 
对 于 在 不 确定 区 域内 的 xz4 和 zi 值 , 方 括号 内 的 量 完全 取决 于 合 
人 误差 。 它 的 值 一 般 是 ! 的 量 级 (这 是 确实 的 , 例如 , 对 表 2 中 的 
前 五 个 中 任 一 对 x; 即 是 如 此 )。 但 是 如 果 丸 -与 灵异 常 靠近 , 那 
么 所 得 的 值 将 非常 大 。 

39. 迭代 的 性 态 可 以 描述 如 下 。 在 蝶 离 特征 值 充分 远 的 点 ， 
计算 的 函数 值 根 对 误差 小 ， 并 且 每 一 步 的 修正 县 与 准确 的 计算 结 
果 相 近 ， 随 着 与 不 确定 区 域 的 距离 缩小 ,计算 值 的 相对 误差 增 大 ， 
虽然 只 要 当前 的 值 是 在 不 确定 区 域 之 外 ,移动 的 方向 是 正确 的 .一 
且 达 到 不 确定 区 域内 ,这 种 有 规律 的 迭代 校正 就 停止 了 , 此 后 , 虽 
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然 两 次 接连 的 计算 中 含 人 误差 的 坏 的 组 合 可 能 得 出 不 确定 区 域 之 
外 的 值 ， 和 通常 逐 次 的 外 近 值 保持 在 不 确定 区 域 之 内 或 不 定 区域 附 
近 ， 

对 表 2 中 的 值 用 计算 信和 各 “ 真 ” 值 执行 有 关 的 计算 是 有 启 
发 性 的 。 注 意 ,这 些 所 谓 的 真 值 也 并 不 是 准确 的 值 ,因为 它们 有 一 
次 会 入 误 差 , 这 是 在 表示 有 限 的 有 效 十 进位 时 固有 的 误差 。 重要 
的 是 要 认识 计算 值 应 正确 到 多 少 位 ,比如 说 , 如 果 要 特征 信 * 一 10 
准确 到 * 个 二 进位 ,那么 当 | 一 101 是 2 量 级 ,计算 a4) 的 
值 正确 到 “一 ”位 二 进位 是 适宜 的 ， 这 样 每 一 步 的 修正 量 与 准 
确 计算 的 结果 相 比 ,所 有 * 一 ”位 都 是 一 致 的 。 

在 表 2 中 ,在 * 一 10 十 ?十 ?7 X 2-9 的 值 给 出 了 约 15 位 
二 进 制 有 效 数字 .如 果 我 取 这 一 个 值 并 用 = 一 10 十 2 十 7X2-9 
和 作 另 一 播 值 点 执行 一 步 线性 插值 ,那么 括 信 的 结果 有 28 十 15 位 即 
43 位 正确 的 二 进位 。 


多 重 的 和 病 坊 靠 近 的 特征 值 


40. 区 间 分 半 法 不 能 用 来 确定 偶数 重 的 多 重 零点 ， 然 而 逐次 
线性 插值 仍 可 以 使 用 。 可 能 想像 这 种 方法 确定 的 多 重 零点 的 精度 
必定 受到 严厉 的 限制 ,但 是 事实 并 不 是 这 样 。 虽 然 收 敛 是 慢 的 ,但 
是 最 终 可 能 达到 的 精度 仍然 只 取决 于 不 确定 区 域 的 大 小 ， 现 在 的 
情况 是 不 如 单 重 零点 那样 好 。 例如 ， 对 于 二 重 特征 值 ,关系 式 
(38.2) 变 成 

2 Se Cok OO— ea) (2 CO— zf 
EQ 一 01) — (1 — #47]. (40.1) 
但 是 我 们 不 能 说 a4 一 42 比 如 -一 hs 小 得 很 多 ,因为 即使 计算 
准确 ,在 每 一 次 迭代 中 误差 只 缩小 1.62 倍 [参见 (2.27)]。 如 果 加 
各 光 分 别 落 在 2* 的 两 侧 , 那么 当 zi 一 4s 是 不 确定 区 域 的 直径 
的 着 干 倍 时 ,不 稳定 性 就 开始 了 。 

如 果 重 特征 值 是 病态 的 。 或 者 虽然 特征 值 不 是 病态 的 但 是 计 

算 行 列 式 值 的 方法 病态 ,那么 不 确定 区 域 相 当 大 。 例 如 , 如 果 我 们 
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用 显 式 的 函数 形式 于 一 3 十 3 一 1, 用 尾 套 法 计算 fz), 我 们 
知道 计算 值 是 下 述 多 项 式 的 准确 值 。 

(1 十 的) 中 一 301 十 6)22 二 301 十 6)s — (lt se), (40.2) 
其 中 6; 的 界 是 2 盘 级 的 。 系数 的 这 种 摄 动 可 以 导致 零点 的 27 
量 级 的 摄 动 (第 二 章 $3)， 因 此 , 不 确定 区 域 的 宽度 是 2“, 是 
某 个 数量 级 为 1 的 数 ， 相 应 地 ， 一 旦 我 们 达到 某 个 *， 其 误差 为 
2 % 量 级 ， 线 性 插 信 不 能 再 稳步 改善 。 可 是 如 果 把 矩阵 作为 三 对 
角 线 型 来 处 理 , 计 算 下 述 年 阵 的 行列 式 
1 

1 
1 
那么 ,包含 一 1 的 不 确定 区 域 的 大 小 是 2”' 数量级 的 ,并 且 x 二 1 
这 个 零点 可 以 精确 地 确定 (关于 确定 重 数 , 见 557). 

制 . 这 个 例子 似乎 是 人 为 的 。 但 是 从 秩 的 简单 分 析 就 得 知 有 
7 重 特征 值 ,并 且 初 等 因子 是 线性 的 三 对 角 线 矩阵 ,其 非 对 角 线 必 
有 + 一 1 个 零 元 素 。 如 果 我 们 考虑 的 特征 值 只 是 运算 精度 的 意义 
下 相等 而 不 是 真 的 重 去 点， 我 们 可 以 给 出 更 加 令 人 满意 的 例子 。 
第 五 章 的 矩阵 及 十 就 是 一 个 好 的 范例 。 尽 管 第 二 个 特征 值 在 运算 
精度 意义 下 与 最 大 的 特征 值 是 恒 等 的 ,但 是 用 30 位 二 进位 尾数 的 
运算 作 逐 次 线性 插值 后 发 现 , 大 的 零点 正确 到 最 后 一 位 .在 运算 精 
度 意 义 下 为 多 重 零点 的 类 似 的 例子 也 已 经 解 过 , 虽然 收 剑 竹 极 慢 ， 
但 是 最 后 可 达到 的 精度 很 高 。 


其 他 的 插值 法 


42. 对 我 们 以 前 讨论 过 的 其 他 播 值 方法 也 可 建立 类 似 的 结 
果 。 在 每 一 种 情况 下 ， 达 到 极限 精度 的 xx 是 在 不 确定 区 域 之 内 ， 
或 者 很 靠近 不 确定 区 域 ， 并 且 在 达到 极限 精度 之 后 也 开始 有 不 稳 
定 的 危险 。 在 最 常用 的 Muller 方法 中 ， 这 个 现象 尤为 显著 ， 关 
于 这 个 方法 ,最 常见 的 现象 是 , 一 旦 达到 不 确定 区 域 之 后 , 继续 作 
的 迭代 得 到 的 结果 具有 非常 一 致 的 精度 ， 但 是 迟早 总 要 出 现 大 的 
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了 且 跃 。 在 一 些 试验 中 ,这 逢 跳跃 非常 激烈 先 代 会 收效 到 别 的 特征 
值 ! 在 程序 库 中 , 当然 用 限制 修正 量 ($62) 来 防止 这 种 现象 发 生 . 

有 一 点 是 值得 特别 提出 的 ， 入 们 可 能 认为 , 即使 计算 函数 的 
方法 使 得 不 确定 区 域 很 小 ，Muller 方法 也 不 能 精确 地 定 出 重 特征 
值 。 其 理由 如 下 。 

例如 ,考虑 多 项 式 (z 一 0.9876273416)?。 如果 我 们 在 任意 三 
个 点 准确 地 计算 1Cz)》 并 导出 和 通过 这 三 点 的 准确 的 多 项 式 , 我 们 
得 到 


DO— 1.975246832z 十 0.9754000118 31509056。 (42.1) 
现在 如 果 我 们 只 用 九 位 十 进位 数 作 计算 ， 就 不 可 能 准确 地 得 到 这 
些 系数 ， 最 好 的 情况 下 我 们 也 必定 在 第 九 位 有 效 数字 上 有 含 人 误 
差 . 通 常 这 将 导致 零点 有 (10”)% 量 级 的 误差。 因此 ,即使 我 们 直 
接 从 表达 式 〈z 一 0.98762 3416)” 计算 fC2), 因而 计算 值 的 相对 
误差 小 , 但 是 与 这 些 值 匹配 的 二 次 多 项 式 必然 给 出 比较 差 的 结果 . 
在 更 实际 的 情况 中 ,在 二 重 零点 的 邻 域内 ,我 们 难以 得 到 像 这 个 很 


特殊 的 例子 的 那样 高 精度 的 函数 值 。 因 此 通常 的 情况 似乎 更 不 利 
些 


这 个 论证 有 雇 误 , 因为 函数 计算 不 是 按 这 种 方式 执行 的 。 如 
果 我 们 用 Muller 方法 ($20), 在 每 次 选 代 中 我 们 都 是 导出 zi 的 修 
正 景 ,考虑 从 (20.6) 导 出 的 增 量 s44, 一 zx 的 表达 式 ,我 们 有 
2 
一 一 2 了 SC2k 一 {tA 
(一 有 -十 友 )] 二 ， (42.2) 
倘若 计算 是 准确 的 ， 那 么 对 于 任何 z4-2, z4-，, zxs 方 括号 内 的 量 
都 会 是 零 。 但 是 实际 计算 并 不 是 这 样 ， 如果 及 , 友 -,s 和 的 最 大 


误差 2: 分 之 一 ,分 母 的 值 与 真 信 至 多 差 节 分 之 一 ,所 以 产生 的 


修正 量 与 准确 计算 的 相差 约 2 分 之 一 。 因 此 ,即使 由 于 我 们 按 昭 
1s 一 2p 一 0 (2-”) 时 计算 值 的 误差 为 ”分 之 一 ， 这 样 的 广 
式 处 理 特征 值 le 而 使 得 计算 的 f(x) 值 的 精度 降低 ， 逐 次 迭代 实 
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际 上 继续 改善 精度 直到 根 对 误差 只 是 2 分 之 几 ， 这 恰恰 就 是 使 
用 某 种 给 出 不 确定 区 域 的 直径 是 2 量 级 的 计算 函数 的 方法 确定 
良 态 的 二 时 特征 值 的 情况 


使 用 导数 的 方法 


43. 通常 使 用 一 个 或 多 个 导数 的 方法 的 行为 与 插值 法 的 很 不 
根 同 . 为 了 研究 单 特征 值 4 附近 的 极限 情况 , 我 们 首先 作 一 个 假 
定 ， 即 在 零点 的 邻 域内 计算 的 导数 的 根 对 误差 小 于 函数 的 根 对 误 
差 ,这 假定 是 很 合理 的 ， 

为 了 说 明 方便 ,我 们 考虑 Newton 法 ($25), 因为 对 所 有 这 样 
的 方法 会 人 误差 对 极限 性 质 的 影响 是 大 同 小 异 的。 如 果 用 大 和 
姑 分 别 表示 f(z4) 和 f(z4) 的 计算 值 ， 那 么 在 一 步 的 修正 量 是 
一 天/ 天， 而 不 是 一 入/ 扩 ， 我 们 写 

天 二 Cl 二 6) ~ (1 + ), (43.1) 
并 且 由 上 面 的 假定 ,在 ze 的 邻 域内 有 
iar! < jski。 (43.2) 
因此 ， 计 算 的 修正 量 和 真正 的 修正 重 之 比 实质 上 是 承 和 所 的 比 。 
用 $38 的 记号 ,我 们 得 到 


Rh HG /HG 
i= 11 


~ G3 — a) /0 — #0). (43.3) 
只 要 lz 一 zi 明显 地 大 于 1 一 九 |， 即 xx 明显 地 在 不 确定 区 
域 之 外 ,计算 的 修正 最 的 相对 误差 就 小 ,但 是 这 两 个 最 趋 近 相同 的 
量 级 时 ， 根 对 误差 就 不 再 是 小 的 。 如 果 在 这 个 阶段 ，z4 是 le 十 
0(9)， 其 中 6 是 小 量 。 真 正 的 修正 量 可 能 产生 str:， 它 是 1 十 
0(6)， 这 里 我 们 假定 了 函数 的 计算 精度 使 不 确定 区 域 与 j 到 根 
邻 的 特征 值 的 距离 根 比 是 小 的 。 因此 ， 计 算 的 修正 量 是 [4s 一 
zh 十 O(9)] /有 ,结果 计算 的 tr: 逼近 如。 我 们 又 一 次 发 现 计算 
的 迭代 值 一 直 改 进 直 到 到 达 不 确定 区 域 为 止 . 
以 后 它 的 行为 与 插值 法 的 不 同 ， 对 于 在 不 确定 区 域内 的 点 
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到 上 上 ,所 的 计算 值 的 相对 误差 仍然 比较 小 。 因此 ， 计 算 的 修正 量 
与 真正 修正 量 的 比值 几乎 由 (43.3) 的 右边 准确 地 给 出 。 同时, 由 
于 真正 的 修正 量 几 乎 准确 地 给 出 zt 一 %, 计算 的 修正 量 给 出 的 
好 几乎 准确 ， 因 此 , 迁 代 是 在 不 确定 区 域内 随机 移动 . 

4 我 们 的 论证 是 以 计算 的 导数 的 相对 误差 比 函 数 信 的 小 得 
多 的 假定 为 基础 的 ,这 个 假定 一 般 是 对 的 ,其 至 对 于 多 重 特征 值 或 
十 分 靠近 的 特征 信 , 对 于 在 不 确定 区 域外 的 z 信 ,这 个 假定 仍然 或 
立 ， 但 对 于 不 确定 区 域内 的 * 全 ,对 于 这 种 园 征 信 , 这 假定 一 般 是 
不 成 立 的 。 事实 上 ,f(z) 的 计算 什 可 能 变 为 零 ， 而 fx) 不 是 
零 . 

然而 , 840 的 评论 同样 适用 于 用 导数 的 先 代 法 。 甚至 在 矩阵 
有 多 重 零 点 或 者 十 分 密集 的 零点 时 ,只 要 相应 的 不 确定 区 域 小 , 零 
点 的 可 达到 的 极限 精度 将 是 高 的 ,只 是 收敛 率 受 到 影响 ， 此 外 ,如 
果 我 们 能 知道 零点 的 重 数 , 使 用 公式 (25.9) 或 (28.12) 可 以 给 出 高 
的 收敛 率 . 


接收 零点 的 准则 


45。 判定 迄 代 法 得 到 的 一 个 值 是 否 可 以 作为 零点 来 接受 ， 是 
一 个 相当 困难 的 实际 问题 。 我 们 先 考虑 一 个 简化 的 问题 , 假定 计 
算 不 带 舍 人 误差 ,使 得 选 代 次 数 充分 多 步 之 后 ,零点 “的 精度 可 以 
达到 任何 规定 的 水 平 . 
现在 ,在 我 们 描述 过 的 所 有 方法 中 ,最 后 有 
ls —al ~ O(lzn — «11), (45.1) 
而 对 于 单 重 零 点 ,我 们 有 更 好 的 结果 
lsm— el = O(n — #1{), (45.2) 
因此 ,终止 选 代 的 一 个 明显 的 准则 是 
1z 一 四 <s， (45.3) 
其 中 。 是 某 个 预先 规定 的 “小 ” 量 ， 可 是 要 注意 ， 如 果 这 个 准则 
也 要 适用 于 包含 多 重 零点 的 问题 ， s 必须 小 于 零点 的 最 大 允许 误 
差 ， 例如, 如果 “是 一 个 重 的 零点 , 我 们 使 用 的 是 Newton 法 ， 
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那么 最 后 有 
~ si 二 tr 一 (err 一 s)， (45.4) 
我 们 到 的 s 必须 小 ,至 少 要 小 于 我 们 规定 的 容 限 的 (7 一 1 一 倍 . 
使 用 某 个 基于 移 代 过 程 中 的 相对 改变 量 的 准则 是 有 了 豚 引力 
的 ,例如 
ICsn — zi)/zil < (45.5) 
这 个 准则 用 在 收 剑 于 z 一 a 天 0 的 零点 是 令 人 满意 的 ， 但 是 如 果 
a 一 0, 那么 对 单 重 零 点 ,我 们 有 
[zm 一 有 /sr > 1, (45.6) 
如 果 我 们 处 理 显 式 多 项 式 ， 那 么 零 特征 值 是 很 容易 发 现 并 且 把 它 
剔除 ， 因 此 ,在 这 种 情况 下 , 如果 所 有 非 零 特征 值 都 是 单 重 的 , 上 
述 规则 可 以 使 用 。 


会 人 误差 的 影响 


全. 继续 上 节 的 分 析 没有 什么 意义 ， 因 为 实际 上 合 人 误差 完 
金 占 了 主导 地 位 。 实际 计算 中 用 给 定位 数 计算 的 任何 零点 , 其 精 
度 受 该 零点 的 不 确定 区 域 限制 ， 而 且 通 常 我们 预先 不 知道 这 些 区 
域 的 大 小 。 如果 我 们 用 准则 (45.3)， 那么 当 我 们 选取 的 s 太 小 时 ， 
无 论 选 代 多 久 , 这 准则 总 不 能 被 满足 。 反之 ， 如果 我 们 选 的 8 太 
大 ,我 们 会 接受 一 个 比 最 后 能 得 到 精度 低 得 多 的 结果 ， 例 如 ,在 良 


是 缓慢 而 持久 的 . 

如 果 零 点 的 不 确定 区 域 相 当 大 ， 那 怕 最 正当 的 要 求 也 不 能 得 
到 满足 。 例 如 ,我 们 用 Frobenius 型 ,其 特征 值 是 1, 2,…, 20, 那 
么 在 ACE 上 执行 单 精度 运算 ( 约 14 位 十 进位 )。 当 e 一 10"?, 对 
于 零点 10, 11, …，19 选 代 过 程 都 不 收效 ， 事实 上 ， 这 些 特 征 值 
有 很 大 的 不 确定 区 域 ， 因 此 不 可 能 发 现 何 时 迭代 信 是 在 特征 值 的 
领域 内 ,除非 我 们 用 的 运算 精度 比 14 位 十 进位 更 高 。 

一 个 理想 的 程序 ， 应 该 能 够 在 定 出 零点 之 前 的 杂乱 无 章 的 适 
代 过 程 中 ,判定 什么 时 候 必须 用 更 高 的 精度 运算 。 另 外 ,程序 应 该 
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设计 成 逐步 改变 运算 精度 , 以 便 确 定 满足 指定 精度 的 特征 信 。 实 
际 计算 中 ,要 求 一 般 没有 这 人 么 高 , 可 以 用 准则 (45.3) ，s 取 某 个 适 
中 的 值 。 
47. Garwick 曾 提 出 一 个 简单 的 策 赂 ,对 于 病态 的 零点 能 缩减 
不 确定 地 选 代 的 危险 ,对 于 良 态 的 零点 则 不 牺牲 可 能 达到 的 精度 . 
他 的 思想 是 以 下 述 的 观察 结果 为 根据 的 .当选 代 值 在 向 零点 逼近 
了 时， 从 某 一 步 超 ， 差 1m+: 一 所 | 逐渐 缩小 , 直到 达到 不 确定 区 域 
为 止 。 以 后 这 个 差 就 像 我 们 以 前 描述 过 的 那样 训 无 规律 地 变化 . 
Garwick 建议 ,应 该 使 用 要 求 限制 松 一 些 形式 为 
lz —z| < (47.1) 
的 准则 . 当 这 准则 被 满足 时 ,只 要 相 邻 的 ;的 差 值 递减 , 就 继续 选 
代 。 当 最 后 我 们 达到 一 个 值 使 得 
| 一 2 |e — zr) (47.2) 
我 们 就 接受 x+: 值 . 
作为 一 个 应 用 的 例子 ,把 Newton 法 用 于 零点 是 1, 2,…, 20 
的 显 式 多 项 式 . 在 ACE 上 用 双 精 度 运 算 ( 约 28 个 十 进位 ) 并 取 
s 一 10“。 对 于 每 一 个 零点 ， 选 代 都 达到 了 在 想 应 的 不 确定 区 域 
之 内 。 在 z 一 1 的 零点 , 接受 的 近似 值 的 误差 约 是 10”, 而 对 于 
病态 的 零点 一 15, 接受 的 近似 值 的 误差 约 10", 因此 都 达到 最 
佳 的 水 平 . 
在 设计 能 自动 识别 何 时 已 达到 极限 精度 的 程序 方面 ， 似 乎 还 
没 做 过 什么 工作 .在 使 用 非 舰 格 化 浮 点 运算 的 计算 机 上 ,这 是 不 太 
困难 的 ; 因为 从 前 面 的 讨论 可 知 ,只 要 计算 的 函数 值 有 某 些 正确 的 
有 效 数 字 , 选 代 就 应 该 继续 下 去 ， 一 旦 达到 某 个 z; 值 , 这 个 值 没 
有 任何 正确 的 有 效 数字 ， 对 所 用 的 计算 精度 及 算法 就 不 可 能 区 分 
#1 与 肖 数 零点 的 差别 。 


消除 已 计算 的 零点 


48， 当 我 们 已 经 接受 f(z) 的 一 个 零点 时 ,我 们 希望 以 后 的 计 
算 不 要 收敛 于 这 个 零点 。 如 果 我 们 用 显 式 的 特征 多 项 式 作 计算 ， 
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那么 当 我 们 已 接受 了 a 后 ,就 计算 显 式 的 商 多 项 式 1C2)/(s 一 0)。 
类 似 地 ,如 果 我 们 接受 了 二 次 因子 一 pz 一 1， 我 们 可 以 计算 商 
多 项 式 fz)/(z 一 pz 一 站 .这 个 方法 通常 称 为 降 阶 。 注意 ,从 
{2.10) 我 们 得 到 


fel 一 四 一 于 se)sr™, (48.1) 


其 中 (a) 是 用 钦 套 乘法 得 到 的 在 > 一 “的 值 ， 而 用 $31 的 记号 
有 


HD/ ps DD ae (48.2) 


实际 上 ,计算 的 零点 或 二 次 因子 通常 都 有 误差 ,在 降 阶 过 程 本 
身 又 发 生 误 差 。 因此 有 这 样 的 危险 , 逐次 计算 的 零点 可 能 遭受 到 
念 来 全 多 的 精度 损失 ， 的 确 , 一 般 认 为 ,在 这 方面 降 阶 过 程 是 极端 
危险 的 。 

在 Wilkinson(1963b) 第 二 章 ， 我 纶 出 了 这 个 问题 的 十 分 详 
细 的 分 析 , 这 里 只 综述 主要 的 结果 

如 果 在 每 次 降 阶 之 前 ， 选 代 继 续 进 行 直到 计算 精 麻 达 到 极限 
为 止 , 那 么 只 要 计算 的 零点 大 致 是 按 绝对 值 递增 的 次 序 确定 的 ,过 
程 就 不 会 逐步 恶化 。 在 一 般 情 况 下 ， 用 计算 的 降 阶 多 项 式 和 不 多 
项 式 进行 迭代 ,计算 的 零点 可 能 达到 的 精度 只 差 一 点 、 男 一 方面 
如 果 多 项 式 的 零点 的 数量 级 祖 差 很 大 ， 一 个 大 零点 的 近似 值 已 被 
接受 ,而 小 零点 还 未 确定 ,这 时 进行 降 阶 就 可 能 使 精度 受到 严重 损 


虽然 降 阶 的 危险 比 平 常设 想 的 小 ， 可 是 好 像 没 有 可 靠 的 方法 
保证 能 大 致 上 按 绝对 值 递增 的 顺序 确定 零点 ， 在 $55 中 我 们 叙述 
不 用 显 式 降 阶 消除 已 计算 的 零点 的 方法 。 
Hessenberg 矩阵 的 降 阶 


49. 计算 了 一 个 零点 之 后 ， 从 显 式 多 项 式 可 以 导出 一 个 包 售 
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其 余 的 (w 一 1) 个 零点 的 显 式 多 项 式 。 自然 要 问 , 对 于 其 他 的 压 
缩 型 是 否 存在 类 似 的 方法 ,如 果 有 ,方法 是 否 稳定 ， 这 个 问题 可 以 
更 明确 地 提出 如 下 : 

如 果 给 定 # 阶 Hessenberg〔 三 对 角 ) 矩阵 的 一 个 特征 值 ， 能 
香 产生 一 个 (= 一 1) 阶 的 Hessenberg (三 对 角 ) 矩阵 包 合 其 余 的 
《2 一 1) 个 特征 值 ? 

我 们 先 考虑 Hcssenberg 蝶 阵 。 设 入 是 上 Hessenberg 矩阵 4 
的 一 个 特征 信 , 不 失 其 一 般 性 ,总 可 以 假定 4 的 下 次 对 角 线 元 素 不 
是 零 ， 现 在， 在 $11 描述 的 Hyman 方法 中 取 * 一 多, 我 们 发 现 
这 个 方法 确定 了 一 个 矩阵 M ,其 形式 为 


对 一 ~ : |. (49.1) 


它 使 得 B 一 (4 一 1) M 的 最 后 一 列 的 元 素 除了 第 一 个 与 

det(4 一 41) 成 比例 之 外 , 全 都 是 零 ， 又 因为 是 4 的 一 个 特征 

值 , det(4 一 ha7) 是 零 . 因此， 最 后 一 列 全 是 零 。 注意 ,除了 最 

后 一 列 之 外 ，B 与 (4 一 1) 完全 相同 ， 当 4 一 5，B 的 形式 
是 

xx 

xx 

B= x (49.2) 


X X X X 


XXXX X 
ooonm 


0 


为 了 完成 相似 变换 , 用 M” 左 怀 B, 其 效果 是 对 于 ; 从 1 到 = 一 
执行 第 = 行 的 x; 倍加 到 第 i 行 。 显然 ，Hessenberg 型 和 最 后 一 列 
的 零 元 素 都 不 受 影响 ,结果 M 一 (4 一 441) M 也 是 (49.2) 的 形式 。 
因此 M (4 一 IM 十 41 是 如 下 形式 : 
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xxxxXxio0 

xxxxi!i0 

! 
xxx!1o0]. (49.3) 

xx!o 

x Ih 


显然 ,左上 和 角 的 (n 一 1) 阶 Hessenberg 和 矩阵 的 特征 秆 是 以 外 的 
全 部 特征 值 . 

50. 因为 三 对 角 手 阵 是 村 essenberg 型 的 特殊 情况 , 我 们 可 以 
应 用 这 个 方法 于 这 样 的 矩阵 , 用 M 右 乘 , 其 前 (4 一 1) 列 保持 不 
变 :现在 (49.2) 变 为 形式 


X X 0 
X X X 0 
xxx ol. (50.1) 
X X 0 
X 0 


用 一 左 乘 ,只 改变 第 (2 一 1) 列 使 矩阵 变 为 形式 


X X x 
xx X 
x x 
x 


(50.2) 


XXX X X 
Soeo oo 


左上 角 的 (# 一 1) 阶 垂 阵 不 再 是 三 对 角 和 矩阵， 其 景 后 一 列 全 是 非 
等 元 素 .。 因此 ,三 对 角 型 关于 这 种 降 阶 法 不 是 不 变 的 . 

把 所 得 的 矩阵 有 君 作 击 一 个 三 对 角 矩 阵 加 上 最 后 一 列 非 零 元 素 
构成 的 一 个 增 凡 皇 对 角 线 托 阵 是 比较 方便 的 。 我 们 可 以 立刻 看 
到 ,这 种 增产 三 对 角 短 阵 关于 这 种 降 阶 方法 是 保 型 的 。 更 确切 地 
说 ,是 4。 的 降 阶 导出 矩阵 C。,4。 和 Cu 的 形式 是 
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X x 
X X 
x 


(50.3) 


x 

x 

x 
xxxx x x xxx 


因此 ,虽然 三 对 角形 形式 不 能 保持 ,但 是 降 阶 矩阵 的 结构 不 会 愈 变 
愈 复 杂 . 


三 对 角 矩 阵 的 降 阶 


851 我 们 已 拒 三 对 角 和 矩阵 的 降 阶 作为 上 Hessenberg 型 的 一 种 
特殊 情况 处 理 , 但 是 如 果 在 第 一 列 而 不 是 最 后 一 列 引 人 非 零 元 素 ， 
那么 这 个 方法 与 58 的 有 更 紧密 的 关系 。 我 们 用 五 阶 和 矩阵 作 例 子 
来 说 明 它 .假定 我 们 取 承 来 的 矩阵 4。 为 下 述 的 形式 

本 工 
Bm 1 
4 一 | Pa 1 . (51.1) 
Bm 1 
Bs os 
设 丸 是 4 的 特征 值 ,我 们 用 下 述 关系 定义 P.(4) 
bob) = 1 PMN) mo hs 
PAN) = or — Ph) — Bp) Cr 2 nt), (51.2) 
485 0 


于 是 ,如 果 我 们 取 M 为 矩阵 
1 


一 六 (2 4 
M 一 | pu) 1 ， (51.3) 
—pPAN) 1 
Pl) 1 
我 们 就 有 
0 1 
0 (o 一 1) 1 
(4 一 2DM 一 | 0 bs (ao — 11) 1 > 
0 pf uh) 1 
0 Bb (a;—%) 
{51.4) 
因为 po(20 一 0, 所 以 (n, 1) 元 素 是 零 ， 因 此 ,我 们 有 
hn 1 
0 wp(h) 1 
MAs— NIM+t hil=|o Bmp) eo 1 
0 Pl) po 1 
0 —p(h) Ps om 
(51.5) 


因此 ,在 右 下 骨 的 《n 一 1) 阶 的 降 阶 矩阵 的 第 一 列 有 额外 的 元 素 
士 加 (20 

用 qt(x) 表示 《4-1 一 z1) 的 > 阶 前 主子 式 ,我 们 有 
(a) 一 1，4a(s) 一 (om (2) + Pb), 
G3) 一 (o 4) Gs) 一 忆 % -Ke + Pr hi) 《r 一 3 2) 

(51.6) 

我 们 可 以 看 出 ,元 素 为 p,(h) 的 列 几乎 没有 增加 递 推 关系 的 复杂 
福 . 

为 了 执行 在 4,-: 找到 第 二 个 特征 值 2 之 后 的 第 二 次 降 阶 ， 
用 下 述 形式 的 矩阵 右 乘 
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1 
—g(%) 1 
4%) 1 
—q(%) 1 
最 后 (* 一 2) 阶 的 降 阶 矩阵 的 形式 是 


m+ 9Ah) 1 


， (51.7) 


—g(h) mm 1 
Gh) py os 


因此 降 阶 矩阵 的 主子 式 的 北 推 关系 从 不 比 (51.6) 复 杂 . 


用 旋转 或 稳定 的 杨 等 变换 降 阶 


52，Hessenberg 和 矩阵 的 降 阶 方法 与 Hyman 方法 有 着 紧密 的 
关系 , 后 者 有 很 高 的 数值 稳定 性 。 类 似 地 , 三 对 角 矩阵 的 降 阶 与 
58 的 简单 的 递 推 关系 相关 联 ， 并 且 这 些 递 推 关系 也 是 十 分 稳定 
的 . 


(51.8) 


尽管 如 此 ， 降 阶 方法 并 没有 同样 的 数值 稳定 性 。 可 能 认为 产 
生 不 稳定 的 原色 在 于 没有 结合 行列 交换 ， 如 果 结 合 行列 交换 或 改 
用 平面 旋转 方法 可 能 得 到 稳定 的 降 阶 方法 ， 现 在 我 们 来 研究 这 个 
问题 

814 已 叙述 了 怎样 逐次 用 平面 (一 1, #2), (# 一 2 np) 
(1, #) 的 旋转 右 乘 把 Hessenberg 甜 阵 最 后 一 列 的 最 后 (= 一 1) 
个 元 素 化 为 零 . 当 = 二 4 时 (% 是 4 的 一 个 特征 值 ), 变 换 后 的 年 
降 的 最 后 一 列 的 第 一 个 元 素 也 是 零 (如 时 计算 准确 )。 因 此, 变换 
后 的 矩阵 将 是 《49.2)》 的 形式 。 为 了 完成 相似 变换 ， 我 们 用 平面 
(nz 一 1, 9), (na 一 2,2)， -…,(1, n) 旋转 过 次 左 冬 ， 显然 , 每 次 
左 乘 保持 最 后 一 列 的 零 元 素 和 左上 和 角 的 (> 一 1) 阶 矩阵 为 Hessen- 
berg 型 不 变 ， 但 是 在 平面 《7+,#)，(r 一 "一 1，…，2) 的 旋转 
在 位 置 (a, r 一 1) 中 引 人 了 非 零 元 素 ， 因 此 ， 加 上 27 之 后 矩阵 
的 形式 是 
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x 

x 
xx Xx 
xxx 
|- 
口 口 口 


。 (52,1) 
xxio 


xXxxXx Xl 
扼 阵 中 最 后 一 行 有 非 零 元 是 无 关 要 紧 的 ， 左 上 角 的 (2 一 1) 阶 矩 
阵 仍然 有 其 余 (a 一 1) 个 特征 值 。 因 此 ,即使 用 旋转 变换 ,Hessen- 
berg 型 关 于 降 阶 是 保 型 的 。 完全 等 价 的 降 阶 过 程 可 以 用 非 西 的 
初等 变换 实现 , 它 也 导出 形 如 (52.1) 的 矩阵 。 

研究 含 人 误差 的 影响 之 前 ， 我 们 先 考虑 同样 的 约 化 方法 应 用 
到 三 对 角 和 矩阵 ， 右 乘 结束 时 变换 后 的 矩阵 的 形式 显然 是 《50.1). 
我 们 要 证 明 左 乘 的 结果 导致 一 个 形 如 (52.1) 的 矩阵 ,也 就 是 说 , 三 
对 角 和 矩阵 通常 变 为 满 的 Hessenberg 矩阵 。 我 们 用 归纳 法 证 明 . 
候 定 用 平面 (r, *) 的 旋转 左 乘 之 后 , 矩阵 的 形式 以 一 7,r 一 4 
为 例 , 是 


0 
0 
0 
0 |. (52.2) 
0 
0 


~ 二 一 一 一 一 -一 一 一 


下 一 个 旋转 是 在 平面 (+ 一 1, ”)， 结果 使 得 第 + 一 工行 各 第 ” 行 
变 为 它们 的 线性 组 合 ， 因 此 ， 第 7 一 1 行 的 第 * 十 1 到 第 + 一 1 
个 元 素 一 般 要 引进 非 零 元 。 第 * 行 只 在 第 "一 2 个 元 素 引 进 非 堆 
元 .初等 的 稳定 的 非 西 变换 也 有 类 似 的 结果 ,但 是 Hessenberg 矩 
阵 中 零 元 素 占 的 比例 还 是 相当 大 的 。 如 果 原 三 对 角 符 阵 是 对 称 
的 * 正 交 的 降 阶 法 能 保持 对 称 性 ,并 且 能 证 明 保持 其 三 对 角 型 。 这 
可 证 明 如 下 。 
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因为 得 到 的 降价 的 矩阵 最 后 一 列 是 零 ， 因 此 最 后 一 行 也 必定 
是 零 ， 反 过 来 ,这 意味 着 用 平面 (r, z) 旋转 左 乘 后 ,，(#, + 十 中， 
(ar 十 2)，…， (4, 一 1) 元素 必定 已 经 是 零 。 事实 上 仍然 必 
须 执 行 的 运算 仅仅 是 用 

(第 # 行 ) cos5, 一 (第 i 行 )sin9; (i 一 + 一 1,.……,1) (52.3) 
代替 第 = 行 。 因为 原 和 矩阵 的 下 次 对 角 线 元 线 不 会 变 为 零 , 我 们 不 
会 有 ecosb; 一 0， 因 为 从 (52.2) 知 ， 第 > 一 1; .…， 工 的 各 行 中 第 
7 十 1 …，( 一 1) 位 置 上 的 元 素 是 零 , 显 然 第 ” 行 的 这 些 元 素 
必定 已 经 是 零 ， 中 此 可 见 , 我 们 不 在 对 角 线 以 上 引 人 非 零 元 素 , 因 
此 最 后 的 矩阵 是 三 对 角 线 形 。 初 等 的 稳定 的 非 西 和 矩阵 的 降 阶 不 保 
持 对 称 性 ,也 不 保持 三 对 角 型 。 


降 阶 的 稳定 性 


53. 现在 ， 我 们 研究 使 人 误差 对 降 阶 本 身 以 及 对 1 的 影响 。 
我 们 首先 考虑 用 平面 旋转 的 Hesscnberg 矩阵 的 降 阶 。 

对 于 右 乘 来 说 ， 第 三 章 $20 ~$26 的 一 般 柱 分 析 ， 立 刻 表明 : 
如 果 Re-iwns Re-ao，。…*, Rs 是 对 应 于 逐次 计算 矩阵 的 准确 的 
平面 旋转 ,那么 最 后 的 计算 矩阵 十 分 接近 于 A4Rs_1sRs-2ae** Ryn。 
这 个 分 析 也 确认 在 位 置 (#, #), (= 一 1,#), -…, (2,7) 上 引入 
了 和 均 元 素 。(1, #) 位 置 上 出 现 零 元 素 。 这 在 准确 的 计算 中 是 得 到 
保证 的 ,可 是 它 不 是 某 个 旋转 的 直接 的 结果 ,我 们 的 一 般 性 分 析 并 
不 说 明 计 算 的 这 个 元 素 将 是 小 的 ,即使 4 准确 到 运算 精度 也 是 这 
样 。 我 们 容易 构造 矩阵 使 其 特征 值 是 良 态 的 , 右 乘 之 后 ， 计 算 
的 (1, #) 元 素 却 十 分 大 。 因此 , 最 后 RiR Re (4 一 
1) Row RaR 的 形式 是 


XXXXXLX 
XxXxXxx,o 
xxxxio 
xxxiol {53.1) 
x xX10 
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其 中 《1 #) 和 (n, 2) 元 素 都 不 小 。 
类 似 地 ,用 平面 旋转 使 对 称 三 对 角 抵 阵 降 阶 ,最 后 计算 的 矩阵 


形 如 
xx 


， (53.2) 


其 中 三 个 用 横 线 标明 的 元 素 ,在 准确 计算 时 应 是 零 , 但 实际 上 可 能 
相当 大 。 

用 初等 的 稳定 的 非 西 变换 降 阶 的 情况 与 上 述 情况 非常 类 似 。 
现在 我 们 来 说 明 ,对 这 样 的 降 阶 在 右 乘 之 后 (1，#) 不 是 零 的 情况 
与 第 五 章 $56 讨论 的 现象 是 紧密 相关 的 。 

我 们 现在 考虑 下 面 的 21 阶 和 矩阵 4 

—10 1 
1 一 9 1 
1 一 8 


， (53.3) 


显然 , 它 与 Wi 有 相同 的 特征 值 . 
4 = 10.7461942 
是 一 个 特征 信 , 有 九 位 正确 的 有 效 数字 、 我 们 用 初等 的 稳定 的 非 
四 变换 执行 《4 一 1) 的 降 阶 。 
第 一 步 是 比较 (21,20) 和 (21,21) 这 两 个 元 素 的 绝对 值 。 如 果 
(21,21) 的 模 比 较 大 ,我 们 交换 第 21 列 和 第 20 列 。 然 后 , 我 们 从 
第 21 列 减 去 第 20 列 的 某 个 倍数 在 (21,21) 位 置 上 产生 一 个 零 元 
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素 . 我 们 马上 看 出 ， 这 个 运算 完全 与 带 交换 的 Gauss 消去 法 用 在 
短 阵 《Wi 一 27 上 的 第 一 步 相同 。 这 两 个 过 程 始终 保持 一 致 ， 
但 是 要 注意 , 在 Gavss 消去 法 中 任 一 阶段 出 现 交换 是 对 应 于 降 阶 
过 程 不 出 现 交换 ,反之 亦 然 。 当 右 乘 做 完 之 后 ,第 20, 19,…,1 列 
恒 等 于 Gauss 消去 法 得 到 的 第 1, 2…， 20 主 行 ， 然而 约 化 后 的 
(4 一 41) 的 第 21 列 等 于 Gauss 消去 法 中 得 到 的 最 后 的 主 行 ， 
结果 应 该 为 零 的 元 素 〈1，21) 实际 上 变 为 一 20.6954139。 在 第 
(21 一 让 列 中 的 元 素 是 在 第 五 章 表 10 中 的 wi, vi 和 wi。 


关于 降 阶 的 总 评述 


54. 在 第 八 章 我 们 要 叙述 菜 些 又 经 济 又 稳定 的 降 阶 方法 ,但 
因为 它们 与 该 章 的 题目 有 密切 的 关系 ， 我 们 把 它 推迟 到 下 一 章 讨 
论 . 

在 本 章 措 述 的 降 阶 技术 总 是 不 能 完全 令 人 满意 . 为 了 保证 降 
阶 后 的 矩阵 有 其 余 的 特征 值 ， 一 般 我 们 不 得 不 计算 特征 值 精度 达 
到 过 高 水 平 , 同时 在 降 阶 过 程 中 又 要 用 高 精度 运算 。 在 显 式 多 项 
式 的 情况 ,只 有 按 绝对 值 递增 的 次 序 确定 零点 才能 避免 这 样 做 ,但 
是 一 般 没有 一 个 简单 的 方法 保证 能 实现 这 个 要 求 。 自然 要 问 , 是 
否 有 其 它 的 不 用 显 式 的 降 阶 消除 已 计算 零点 的 方法 。 


消除 已 计算 的 零点 


55. 设 f(x) 是 以 某 种 方式 定义 的 多 项 式 , 不 必 是 显 式 的 ,又 
设 2 4，，…*，4s 是 它 的 零点 。 如 果 前 > 个 零点 的 近似 值 41， 
1-…， 和 已 被 接受 ,那么 我 们 用 下 述 关系 定义 函数 gs)。 


saO=1OV/Te 一 区 . G55.D) 


假如 每 一 个 1 准确 等 于 对 应 的 的 话 ， g(x) 就 是 零点 为 
lt ,4s 的 (# 一 +) 次 多 项 式 ， 可 是 ,即使 4; 不 准确 ， 函 数 
Cs) 一 般 也 有 零点 4 十 1,*……,24s。 事 实 上 ,不 管 对 的 值 的 大 小 ， 
除非 这 些 值 中 有 些 恰巧 与 in， ……，4。 中 基 个 的 信 重 合 ,8,(2) 总 
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有 这 些 零点 。 假 如 我 们 能 计算 蕊 s) 在 指定 的 x* 上 的 值 ,那么 只 要 
用 (zs 一 2) 的 计算 管 去 除 计算 的 f(z) 就 得 到 g,《z)。， 因 此 ,我 
们 可 以 立刻 应 用 任何 一 个 只 需 函 数值 的 方法 计算 gr(s) 的 乱 点 。 
用 Newton 法 需要 函数 8(z)18:Ce) 的 值 , 但 是 因为 我 们 有 
Be) /ge) = FH 一 > l/s — 1 (55.2) 


1 
六 此 只 要 我 们 能 计算 f(x) 及 f(z)， 我 们 就 能 计算 这 个 函数 值 。 
最 后 ,关于 需要 g(x) 的 方法 ,我 们 有 

[gC /8 COT — gr Ca) /g(a) = [FO FOOT ~— FC) /f(x) 


— DU — 1. (55.3) 
因此 我 们 能 计算 迭代 法 需要 的 一 切 . 


消除 已 计算 的 二 次 因子 


56. 消除 已 计算 的 二 次 因子 有 一 些 类 似 的 技术 ， 它 们 可 用 于 
Bairstow 类 型 的 方法 。 假定 我 们 已 经 接受 了 一 个 二 次 因子 2 一 
Ps 一 上。 假如 它 是 准确 的 , 而 且 我 们 又 能 准确 地 计算 显 式 多 项 式 
8( 一 了 (2)/(z' 一 Pe 一 工 ) 的 话 ， 那么 Bairstow 方法 中 每 步 的 
本 质 要 求 是 计算 一 个 剩余 ， 它 是 在 g(x) 接连 两 次 被 尝试 的 二 次 
因子 ”一 Px 一 1 中 后 的 剩余 。 因此 , 需要 直接 由 1(x) 本 身 的 
运算 得 到 这 些 剩余 的 公式 。 假 定 

Fe = Ts — pr —I) tt{es+d)(s— ps — i) 

十 az 二 六 (56.1) 
a5 5 是 $531, 32 的 量 ,4i, Ti Ts， 现在 ,如 果 

gz) = Vs pa mi) + (est a)(s— pz i) 

二 as 二 6", (56.2) 


那么 
(2—Pps— LNVG — pe 1) 
+ (esta) — pz— i) + as + 
王 TCD 人 (2 一 pz 一 站 
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十 (cs 十 有 四 (一 ps 一 站 二 az 十 志 {56.3) 
这 个 伍 等 式 使 我 们 能 利用 4, 5, c,d 表示 a”,b",e”, d”， 因 而 
从 对 应 的 1(z) 的 剩余 得 到 对 应 g(x) 的 剩余 ， 
按照 Handscomb〈1962)， 稍 为 改变 记号 ,我 们 可 以 表示 这 个 
结果 为 下 述 形 式 


p=—p—P, r=i—L, 

f= pr tl, e=f"— ip?, 

a =al— bp’, b' = bf — alp', (56.4) 
cce—a, dde mb — ap 

ae = a’, be=b, 


me dp, dem dl— elp, 
注意 , 当 "趋向 于 堆 的 时 候 , a” 和" 也 是 趋 于 零 。 此 外 , 因为 
4 是 最 后 二 次 收 化 的 , 因此 对 a”, 2" 亦 然 。 所 以 ， 即 使 接受 的 
二 次 因子 * 一 Pz 一 工 很 差 ， 我 们 仍然 能 真正 地 收敛 于 f(z) 的 
零点 。 因为 我 们 不 要 考虑 a, ,c,d 的 任何 常数 倍数 ,我们 可 以 
取 


a es, 加 一 be， 

人 一 
显然 , 队 a”, 3”, 2 出发， 我 们 可 以 用 同样 的 方式 消除 另 一 个 
二 次 因子 , 依 此 类 推 . 


(56.5) 


关于 消除 零点 方法 的 总 评述 


57. 初 看 起 来 ,这 些 方法 是 比较 危险 的 ,例如 ,函数 包 (z) 仍然 
有 蕉 z) 的 全 部 圭 点 并 且 有 一 些 航 点 (i 一 1，-……，r)， 这 些 极 
点 很 靠近 对 应 的 零点 。 但 是 , 实际 上 我 们 是 用 &,(z) 的 计算 值 推 
算 的 ， 而 这些 计算 值 又 是 从 fx) 的 计算 值得 到 的 。 这 些 方法 在 
实际 应 用 中 的 基本 特点 是 计算 精度 应 始终 一 样 . 

现在 我 们 考虑 一 个 典型 的 gr(s) 值 的 计算 。 1(x) 的 计算 值 


是 [ (z 一 和)， 其 中 五 是 ;的 不 确定 区 域内 的 值 ， 这 些 值 当然 
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与 = 有 关 。 已 计算 的 委 点 ;也 是 在 不 确定 区 域内 ,或 者 很 靠 近 不 
确定 区 域 ， 轴 而 ,计算 的 &) 值 书 丰 (2 一 区/ 让 (一共. 
因此 , 当 不 是 太 靠 近 2(; 一 1， …， 站 时 。gCe) 的 计算 信 本 质 
上 是 贡 《+ 一 区、 因此 ,我 们 可 以 期 六 像 杠 玉 地 使 用 f(s) 的 人 


那样 ,使 用 &(z) 的 值得 到 余下 的 任何 一 个 零点 。 如 果 z 在任 一 
个 261，r) 的 命 域内 ,计算 的 值 变化 很 大 ， 再 次 收敛 于 
其 个 零点 的 情况 几乎 不 会 发 生 。 自然 我 们 必须 避免 在 “一 对 上 
讨 算 函 数值 ,这 是 容易 办 到 的 。 

在 这 个 论述 中 假定 了 1 是 单 重 零点 。 可 是 多 重 的 或 病态 千 
近 的 零点 ,也 不 会 发 生 任 何 特 殊 的 困难 . 仅 当 不 确定 区 域 大 时 , 结 
果 的 精度 低 ， 实际 上 ,此 时 不 确定 区 域 是 大 的 ; 例如 , 对 于 最 式 多 
项 式 就 是 如 此 。 因此 ， 如 果 f(x) 有 一 个 二 重 零 点 z 二 入 一 %， 
并 且 我 们 已 计算 了 一 个 零点 ,那么 如 果 > 是 在 % 的 不 确定 域 之 
外 ,f(z)/(s 一 丸 ) 的 计算 值 的 性 态 就 像 在 z 一 4 的 邻 域内 有 一 
个 单 重 零点 的 函数 一 样 ， 在 ACE 上 曾 用 这 个 消除 零点 方法 计算 
了 高 达 5 重 的 零点 ,它们 的 误差 都 不 大 于 不 确定 区 域 的 大 小 。 

我 们 注意 到 偶然 接受 了 一 个 误差 大 的 零点 并 不 影响 以 后 的 计 
算 零 点 的 精度 , 但 是 如 4 已 被 接受 但 是 它 没 达到 极限 的 精度 ， 那 
么 我 们 可 以 希望 过 程 再 次 收 敏 于 一 个 真 的 达到 极限 精度 的 2 的 
近似 值 。 因为 通常 程序 是 设计 成 确定 ”= 次 多 项 式 的 ”个 零点 , 搂 
受 了 一 个 假 的 零点 就 意味 着 漏 掉 一 个 真 零点 。 

消除 方法 的 一 个 重要 特点 是 独立 地 确定 每 一 个 零点 ， 计 算 的 
零点 之 和 等 于 原 和 矩阵 的 迹 .这 一 事实 可 以 作为 检验 精确 度 的 一 个 
好 的 手段 。 但 是 这 对 于 许多 消除 方法 是 无 用 的 。 时 常会 发 生 这 样 
的 情况 ,计算 的 零点 之 和 是 正确 的 ,但 是 每 一 个 零点 与 特征 值 毫 无 
相似 之 处 ， 例 如 ,用 显 式 多 项 式 降 阶 ,即使 我 们 在 除了 最 后 一 步 的 
各 步 中 随机 地 接受 茶 个 值 的 零点 (最 后 一 步 , 是 一 次 的 多 项 式 不 用 
迭代 就 得 到 零点 ) ,容易 看 出 它们 的 和 也 是 正确 的 。 
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渐 近 收效 率 


58. Newton 法 (5 25) 和 Laguerre 方法 ($ 28) 应 用 于 p(s) 
时 ,保持 二 次 收敛 性 和 三 次 收敛 性 并 不 是 一 恕 就 能 看 出 的 ， 现在 
我 们 证 明 事 实 上 这 是 对 的 。 我 们 首先 考 志 Newton 法 , 假定 z 一 
lsri 十 js 于 是 我 们 有 


ED DD 


1h+ 4) ,58D) 
其 中 史 " 表示 和 数 中 没有 # ~ ， 十 1 的 项 ， 因 此 


gs) /gle) 一 116 十 4 十 OO) (58.2) 
其 中 
4 BG) DU (583 
这 给 出 
so— gs)/g (2) = hn tt AR + OF), (58,4) 
对 于 Laguerre 方法 我 们 用 公式 
wen — sr [Cn — r)g (sl/ {gat{(r — rr — llg(zn)] 
— (a—r)(e or — Des)er (Ca)})}, {58.5) 
我 们 仍然 取 z4 一 tr 十 并 使 用 (55.2) 和 (55.3), 可 以 验证 


sm bn r+ DB A —r—), 
(58.6) 
其 中 4 由 (58.3) 定 义 , 下 由 下 式 定义 


B= Wn 一 太一 2 WG 一 人， (58.7) 
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大 范围 的 收效 性 
59， 到 现在 为 止 ， 我 们 避 开 了 怎样 选取 特征 和 值 的 初始 近似 值 
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的 问题 。 自然, 如 果 我 们 从 独立 的 方法 得 到 了 初始 近似 值 ,那么 本 
章 的 方法 是 很 合用 的 ， 实 际 上 这 些 独 立 的 方法 最 经 常 的 是 用 作 确 
定 特征 值 的 单独 的 工具 . 
当 我 们 知道 全 部 特征 值 都 是 实 的， 那么 情况 是 令 人 十 分 满意 
的 。 就 Laguerre 方法 来 说 ， 我 们 知道 从 任何 近似 的 初 值 开始 都 
保证 收敛 子 它 相 邻 的 零点 。 一 个 简单 的 办 法 是 对 每 个 堆 点 都 取 
14lls 作为 初始 值 ,并 使 用 $55 讨论 的 消除 零点 的 方法 ， 这 个 简单 
的 方法 的 全 遍 收 敛 竹 是 令 人 十 分 满意 的 ， 除 非 4 有 某 些 多 重 零点 
或 病态 靠近 的 零点 ， 对 于 这 种 零点 (28.12) 意 味 着 
St — hn ~ Cok O— Lm)y (59.1) 


并 且 


ah — hn ~ CCzt 一 ln) (59.2) 
这 给 出 
(zr2 — Bit1) ~ Chaar ~— 24), (59.3) 
记 ztr 一 路 一 As 我们 有 
Asirf Ast ~ C. (59.4) 
Parlett 《1964) 认为 ,通常 收 合 于 单 重 堆 点 是 很 快 的 ， 甘 此 如 果 从 
某 一 点 起 有 
TAsin/ Azi| AAs/ AAs > 0.8, {59.5) 
那么 可 以 假定 这 个 被 逼近 的 零点 至 少 是 二 重 的 , 并 且 (28.13) 应 该 
用 + 一 2。Parlett 发 现 , 迭代 三 次 之 后 用 这 个 规则 是 相当 安全 的 。 
这 个 过 程 可 继续 去 识别 重 数 更 高 的 零点 . 
如 果 我 们 用 Newton 法 和 555 叙述 的 消除 方法 ， 用 1 4 必 作 
为 各 个 零点 的 初 值 。 显然 ， 我 们 以 单调 递 降 的 次 序 得 到 特征 值 . 
最 后 ,如 果 我 们 用 逐次 线 狂 插值 ,并 且 以 (1.1) 1|4lls 和 上 4lls 为 初 
始 值 , 我 们 也 是 以 递 降 次 序 得 到 特征 值 ， 后 两 个 方法 在 大 范围 收 
伍 性 方面 不 如 Laguerre 方法 好 ,并 且 似 乎 值得 去 尝试 得 到 更 好 的 
初始 值 .因为 以 递 降 次 序 确定 特征 值 ,上 一 次 计算 的 零点 是 下 一 个 
零点 的 上 办 , 但 是 消除 方法 不 能 应 用 它 。 对 于 Newton 法 的 第 二 
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步 以 后 , 可 以 用 二 (ho 十 jw-) 作为 初 给 值 。 对 于 逐次 插值 方法 


可 以 用 二 (4m 十 24%) 和 二 (2aw-, 十 ia) 作 初 始 值 ， 当 jw-: 等 


于 le 时 ， 应 该 用 4w-s，…, 4 中 第 一 个 大 于 4m-: 的 值 代替 
Xm 假如 这 样 的 值 不 存在 ， 就 用 141 代替 4。_1。 值得 注意 的 
是 ,我 们 可 以 用 任何 一 个 已 知 的 特征 值 的 上 界 代替 1.4-。 如 果 4 
是 从 厌 和 矩阵 4。 经 相似 变换 得 到 的 ， 那 么 很 可 能 发 生 
14ls 光 14ollws，。 这 时 最 好 用 14oll>。 最 后 的 两 个 方法 不 仅 以 单调 
遵 降 次 序 确定 零点 ,而 且 以 单调 的 方式 收敛 于 各 个 零点 。 

当初 始 信 比 所 有 特征 信 都 大 很 多 时 ,无 论 Newton 法 或 者 是 
逐次 线性 插值 的 收敛 速度 都 是 相当 慢 的 。 利用 Kahan 和 Maehly 
独立 发 现 的 结果 (未 发 表 ) 可 以 减少 迁 代 次 数 。 假 定 


+ 有 > 加 (59.6) 
下 一 个 近似 值 由 2 倍 的 Newton 修正 量 给 定 为 
§ = x 21C) FY). {59.7) 


假定 所 (i 一 1,……,n 一 1) 表示 f(x) 的 零点 ,并 且 使 得 
Ci 
(59.8) 
现在 我 们 证 明之 pn。 因为 F(x) = (x 一 1w)， 显 然 对 于 
+ 之 mm, 所 有 了 的 导数 都 是 非 负 的 。 因 此 ,我 们 可 以 写 


faz) = fm) 十 3 Bx — ta) (5, > 0), (59.9) 


并 且 有 
§—m= (rm) — 21(x) /f(x) 


-4 一 一 2[KD+ 实 os—ay ]/ 


区 Ci 


=- 上 cx 一 一 Me 
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pb rblx — py, (59.10) 


2 


因为 Hm) < 0 并 且 本 0, 因此 分 子 、 分 母 都 是 由 非 负 的 项 组 
成 ,所 以 三 > 和， 注意 , 我 们 只 要 求 和 pn 都 是 实数 ， 并 且 对 于 
+ 之 pm 了 的 所 有 导数 都 是 非 负 。 这 个 证 明 适 用 于 f(x) 一 各 一 1 
就 是 一 个 例子 。 

类 似 地 ,用 逐次 线性 插值 队 大 于 4 的 两 个 值 入 和 x 开始 , 我 
们 可 以 应 用 线性 插值 给 出 的 双重 位 移 ， 得 到 的 值 不 会 小 于 m。 这 
是 因为 如 果 入 > xz。 线性 插值 法 的 修正 量 小 于 Newton 法 在 点 * 
上 的 修正 量 ， 
因此 ,我 们 可 以 安全 地 应 用 双重 位 移 技术 ,如 果 特征 值 是 一 个 
单 重 的 , 迭代 值 不 会 小 于 上。 迭代 值 是 单调 好 递减 直到 得 到 小 于 
多 的 值 为 止 。 下 一 个 位 移 将 是 正 的 ， 这 时 可 以 不 再 用 双重 位 移 ， 
注意 , 这 个 证 明 对 任何 重 数 的 特征 值 都 是 正确 的 ， 特别 是 如 果 加 
是 多 重 特征 值 , 双重 位 移 方法 从 不 会 给 出 小 于 4 的 值 ， 并 且 在 舍 
人 误差 起 主要 作用 之 前 收敛 始终 是 单调 的 ，Kahan 大 大 地 推广 了 
这 个 思想 ,并 对 于 Muller 方法 取得 了 进一步 的 结果 

当 4 是 对 称 的 成 拟 对 称 的 三 对 条 矩阵 时 ， 我 们 可 以 由 Sturm 
序列 性 质 和 区 间 分 半 法 (第 五 章 $ 39) 得 到 特征 值 分 布 的 信息 . 
此 ， 我 们 可 以 招 区 间 分 半 法 和 本 章 的 方法 结合 起 来 。 Dekker 
《1962) 提 出 了 一 个 招 区 间 分 半 法 和 逐次 线 竹 插 值 结合 起 来 的 很 出 
色 的 方法 ,一 旦 发 现 一 个 区 间 内 有 零点 , 它 就 可 用 来 确定 该 零点 。 
这 方法 对 任何 实 函数 都 适用 。 


复 零点 


60. 对 于 实 的 或 复 的 矩阵 的 复 零 点 ， 我 们 不 再 有 任何 有 保证 
的 收 敏 方法 。 通常 Laguerre 方法 似乎 有 非常 好 的 收敛 性， 但 是 
Parlet〈1964) 已 指出 存在 简单 的 多 项 式 , 用 某 些 初始 信 开 始 , 迭 
代 是 重复 的 无 限 循环 。 他 考虑 函数 z(2 十 人 ,2 > 0, 对 这 函数 

at+1 3 二 25(5 一 353)34], (60.1) 


» 498 


如 果 而 一 3-46, 出 有 本 一 一 %，s 一 xs。 其 他 的 所 有 方法 都 可 
能 出 现 这 种 死 循 环 ， 特 别 是 只 有 Muller 方法 和 Laguerre 方法 能 
够 对 实 通 数 从 实 近 似 值 产 生 复 的 迭代 ， 但 也 不 能 排除 上 述 的 死 特 
环 。 还 存在 一 个 复杂 的 情况 是 , 死 循环 是 因为 病态 而 不 是 所 用 方 
法 的 本 质 性 失败 ， 在 这 种 情况 下 , 用 充分 高 的 精度 计算 会 排除 死 
循环 。 

不 可 否认 , 这 些 评论 是 对 本 章 的 各 个 方法 的 严厉 批评 ， 小 心 
谨 模 的 人 可 能 不 想 用 这 些 似乎 磁 运 气 才 成 功 的 方法 ， 但 是 我 们 记 
住 这 样 的 事实 是 有 益 的 ， 即 对 一 般 特征 值 问题 还 没有 别 的 能 保证 
以 可 接受 的 计算 时 间 给 出 结果 的 方法 。 据 我 们 的 经 验 ， 基于 本 章 
的 方法 的 程序 是 非常 强 有 力 的 ， 而 且 也 属于 精度 最 好 的 方法 之 列 . 


建议 


61. 对 于 实 矩阵 ,我们 使 用 的 方法 中 最 有 效 的 是 Laguerre 方 
法 和 Bairstow 方法 的 组 合 , 对 于 每 一 个 零点 先 用 Laguerre 方法 ， 
如 果 过 程 对 于 推定 的 迭代 次 数 和 得 不 到 收敛 就 转 用 Bairstow 方 
法 .实际 计算 中 ,的 值 我 们 已 用 到 32， 其 实 通常 Laguerre 方法 
仅 要 4 到 10 次 迭代 就 收 伍 。 我 们 采用 $55~356 的 消除 方法 ， 而 
不 用 降 阶 方法 . 

如 果 和 矩阵 是 一 般 的 形式 的 ， 我 们 宁愿 先 招 它 化 为 Hessenberg 
型 , 然后 用 它 来 计算 函数 值 和 导数 值 。 单 精 度 计算 几乎 总 能 给 出 
很 满意 的 正确 的 数字 , 这 些 数字 不 因原 矩阵 的 元 素 摄 动 2 分 之 用 
而 改变 。 作 为 通用 方法 ,除了 下 一 章 Francis 的 方法 外 , 这 个 方法 
已 被 证 明 比 我 们 已 经 使 用 过 的 其 它 方法 都 优越 . 

我 们 也 做 过 试验 , 招 矩 阵 进一步 化 为 三 对 角 型 。 我 们 建议 在 
化 为 三 对 角 型 的 运算 中 ,在 执行 其 函数 值 . 导 数值 的 计算 中 都 要 用 
双 倍 精度 ,这 是 为 了 防止 特征 值 的 条 件 变 坏 对 于 阶 数 大 于 16 的 
矩阵 , 这 种 算法 比 单 精度 的 用 Hessenberg 型 的 快 , 并 且 除 了 极 少 
数 条 件数 严重 恶化 的 情况 外 , 三 对 角 和 矩阵 给 出 更 精确 的 结果 . 
此 ,我 喜欢 采用 Hessenberg 型 可 能 是 考虑 得 过 于 说 侦 的 缘故 。 
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虽然 ,我 们 已 经 清楚 地 知道 使 用 Frobenius 型 是 危险 的 , 它 的 
条 件 可 能 比 原 矩 阵 坏 得 多 ,但 是 ,我 们 发 现 这 种 方法 的 程序 在 阻尼 
机 械 或 电力 系统 中 产生 的 矩阵 使 用 , 一 和 裔 是 出 平 意料 地 满意 。 通 
常 对 应 的 特征 多 项 式 是 良 态 的 。 若是 这 样 ,这 种 以 显 式 特征 多 项 
式 为 基础 的 方法 是 又 快 又 准确 。 


复 矩 阵 


62. 似乎 很 少 有 需要 解 复 元 素 的 一 般 和 矩阵 问题 ， 对 于 在 国立 
物理 实验 室 中 用 本 章 的 方法 求解 的 几乎 所 有 和 抑 阵 ， 采 用 了 Mulier 
方法 ， 原 矩阵 如 果 是 一 般 形式 ,计算 是 对 已 约 化 成 Hesscaberg 型 
的 矩 隆 以 单 精 度 执行 的 可 是 有 一 些 抵 阵 本 身 就 是 三 对 角 型 ， 对 
这 种 矩阵 就 用 $ 8 的 方法 ,用 单 精度 计算 . 我 们 提出 一 组 8 个 105 
阶 (我 们 处 理 过 的 复 甜 阵 中 最 高 的 阶 ) 的 复 三 对 角 和 矩阵 来 说 明达 到 
的 精度 ,而 后 的 分 析 表 明和 任 一 个 特征 值 的 航 大 误差 小 于 224i， 
这 个 精度 是 用 46 位 二 进位 尾数 运算 达到 的 ,每 个 特征 值 的 平均 选 
代 次 数 是 10 次 。 

在 所 有 和 迭代 的 特征 值 程序 中 ， 在 开始 迭代 之 前 都 计算 了 特征 
值 的 上 界 , 其 中 原 和 矩阵 的 型 与 计算 时 使 用 的 矩阵 的 型 不 同时 ,我 们 
采用 了 项 矩阵 和 约 化 后 的 矩阵 的 无 穷 范 数 中 小 的 那个 ， 这 范 数 给 
出 了 所 有 特征 值 的 上 界 。 当选 代 全 超过 这 个 范 数 时 就 用 某 个 适当 
的 值 代替 迭代 值 ,完成 这 种 替代 的 方式 不 是 关键 的 ,但 是 如 果 没 有 
这 种 措施 ， 当 计算 的 迄 代 值 远离 特征 值 的 不 确定 区 域 时 就 需要 过 


多 的 迁 代 次 数 。 例如 ， 对 于 多 项 式 思 一 1, 取 = 一 二， 并 使 用 


Newton 法 就 产生 偏差 , 下 一 个 近似 值 约 是 2”/20, 而 再 回 到 有 关 
的 区 域 的 送 代 过 程 可 能 十 分 蚀 。 
含有 独立 参数 的 矩阵 


63. 从 我 们 的 评论 可 以 看 出 ， 当 特征 值 的 近似 值 可 从 某 个 独 
立 的 来 源 得 到 时 迭代 法 似乎 最 为 有 利 。 有 一 个 重要 的 情形 , 这 种 
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近似 值 的 确 可 以 得 到 。 这 就 是 矩阵 的 元 素 都 是 参数 "的 函数 , 并 
且 需 要 了 解 某 些 特征 值 或 全 部 特征 值 随 着 ” 的 变化 的 情况 。 
这 种 情形 在 讨论 如 下 广义 特征 值 问题 时 很 常见 ， 
det[ Bo(z) 十 1Bi(o) 十 … 十 2rBi(o)] 一 0。 (63.1) 
一 个 重要 的 例子 是 空气 动力 学 中 的 “ 额 拔 ”问题 。 对 这 个 问题 
"中 2, 而 ”是 飞机 的 速度 , 特征 值 实 部 为 零 时 相应 的 ” 值 是 额 振 
速度 ， 

对 于 某 个 初始 速度 mw， 完 全 地 解 了 这 个 特征 值 问题 ， 并 县 对 
序列 ve, vy，*…* 妃 脉 某 些 或 全 部 特征 信 的 历史 。 如 果 逐 次 的 v; 
之 间 的 差 保持 充分 小 , 每 一 个 在 v; 的 特征 值 就 可 用 作 ws 对 应 的 
特征 值 的 好 的 近似 ， 在 ACE 上 的 程序 使 用 了 Mulier 方法 ,程序 
中 用 带 行列 交换 的 Gauss 消去 法 直接 从 Bu(z) 十 481(v) 十 … 十 
2B,(v) 得 到 通 数 值 ， 实 际 计 算 已 证 明 这 个 程序 特别 成 功 。 虽然 
从 (vi) 的 差 会 得 到 更 好 的 初始 近似 值 ， 但 是 因为 实际 上 总 是 需 
要 收敛 于 ”的 某 个 区 闻 , 我 们 没有 必要 作 进一步 的 改进 。 训 无 颖 
问 ,逐次 线性 插值 法 也 有 获得 好 结果 的 能 力 , 但 是 我 们 没有 这 方面 
的 经 验 。 ACE 的 程序 普 十 分 成 功 地 解决 了 这 样 的 广义 特征 值 问 
题 ，B; 是 6 险 复 矩阵 ,7 等 于 5， 因 而 对 于 每 一 个 ”都 有 30 个 特 
征 值 。 


附注 

Machly (1954) 的 论文 引起 了 人 们 对 Laguerre 方法 的 兴趣 。 
Parlett(1964) 对 这 个 方法 在 实际 计算 中 的 有 效 性 作 了 详尽 的 分 析 . 
我 们 认为 ,读者 非常 有 必要 仔细 研究 他 的 论文 。 迭代 法 的 实 路 经 
验 揭示 了 一 个 重要 问题 ,注意 方法 的 一 切 细节 ,尤其 是 对 竺 确定 可 
达到 的 极限 精度 时 ,以 及 识别 去 点 的 多 重 性 和 病态 ,这 些 方面 都 是 
自动 程序 取得 成 功 所 必 不 可 少 的 . 

正当 本 书 付 印 了 时 ，Traub (1964) 发 表 了 一 篇 关于 和 迭代 法 的 出 
色 的 论文 ， 其 内 容 有 用 Newton 插值 多 项 式 代替 Lagrange 插值 
多 项 式 来 改进 Muller 方法 ， 对 二 次 插值 ,用 通常 的 差 商 的 记号 我 
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们 有 
Hw) = fw) 十 Cw — wi)fl wi, wi-] 
十 (Co 一 好 oo — wi Ew wi-ss wi-a] 
= Hw) + Cw — wi){flw;s wi-s] 
+ (wi — wi fl ws wi-ss wial} 
+ Cw — wi) Hwis wiss wes] 
= fw) + (Cw CO— wi)p + (wv — wi)g。 (比如 说 》 
这 给 出 
we wi — 2f(wi)/ {p+ Ep — 4f(w)9]1}, 
因为 [wis ws- wi-2] = 人 [wii — fiwiss wal}/ (wi 一 
wi-?)， 在 每 一 步 我 们 只 要 计算 fLwi, wi-:]， 
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第 八 章 LR 和 QR 算法 


引言 


1 在 第 一 章 $42 中 我 们 已 经 证 明了 尾 何 矩阵 都 可 以 用 相似 
变换 约 化 为 三 角 型 。 在 $47 又 进一步 证 明 可 以 用 酉 阵 作为 变换 逢 
阵 。 抑 阵 约 化 后 得 到 它 的 特征 多 项 式 的 零点 。 因此 , 实现 这 种 约 
化 的 任何 算法 本 质 上 一 定 是 迭代 方法 . 

根据 第 一 章 $ 48 的 证 明 , 约 化 正规 拭 阵 为 三 角 型 的 西 变换 实 
际 上 是 把 矩阵 约 化 为 对 角 型 。 在 实 对 称 第 阵 的 情况 、Jacobi 方法 
(第 五 章 3) 实 现 了 这 种 约 化 ， 这 个 方法 的 基本 技巧 是 用 一 系列 初 
等 正 交 变换 逐步 缩小 对 角 线 以 上 的 元 素 构成 的 矩阵 的 范 数 。 由 于 
变换 保持 矩阵 的 对 称 性 ,因此 ,对 角 线 以 下 的 元 素 构成 的 矩阵 的 范 
数 同时 缩小 。 

在 正规 矩阵 的 情况 下 ，Jacobi 方法 可 以 用 相当 简单 的 办 法 来 
推广 (Goldstine 和 Horwitz，1959)。 对 一 般 矩 阵 , 人 们 自然 也 试 
图 用 类 似 的 技巧 把 矩阵 约 化 为 三 角 型 。 可惜， 尽管 已 作 了 许多 努 
力 ， 但 所 得 的 算法 实际 上 都 比 不 上 第 六 章 和 第 七 章 描述 的 那些 比 
较 成 功 的 方法 。 

在 第 七 章 $49~§54 叙述 的 降 阶 法 可 实现 把 Hesseaberg 型 矩 
阵 约 化 为 三 角 型 , 但 是 ， 它 是 数值 不 稳定 的 .在 第 九 章 ; 我 们 要 令 
述 稳定 的 降 阶 方法 ， 它 们 可 以 通过 相似 变换 把 一 般 的 矩阵 约 化 为 
三 角 型 . 

本 章 我 们 研究 LR 和 QR 这 两 个 算法 ， 第 一 个 算法 是 Ruti- 
shauser 《1958) 首 创 的 。 他 利用 非 西 变换 约 化 一 般 矩 阵 为 三 角 型 ， 
在 特征 值 问题 这 个 领域 ,我 认为 这 是 自动 计算 机 问世 以 来 最 有 意 
义 的 发 展 。 后 来 , 由 Francis 提出 的 OR 算法 与 LR 算法 是 密切 
相关 的 ,但 9R 算法 是 基于 使 用 酉 变换 的 。 在 许多 方面 ， 已 证 明 
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解 一 般 代数 特征 值 问题 的 现 有 方法 中 , OR 方法 是 最 有 效 的 。 


有 复 特 征 值 的 实 和 矩阵 


2。 对 于 有 复 共 圈 特 征 什 的 实 算 阵 ， 三 角 型 的 缺点 是 涉及 复 
数 域 .这 里 提出 一 个 “改进 的 三 角 现 ”, 为 的 是 使 实 和 矩阵 的 研究 可 以 
保持 在 实数 域内 。 我 们 首先 证 明 : 如 果 4 是 实 矩 阵 , 它 有 特征 值 
石 十 ia， 和 二 ia i 中 
是 实数 ,那么 存在 的 实 和 矩阵 妃 使 得 8 = H4HT!， 


B~— …。 >» (2.1) 


an 

在 B 的 对 角 线 上 ,X, 为 2 x 2 秆 阵 且 含有 特征 信 4 土 ， 适 阵 
的 决 对 角 维 以 下 全 是 零 .这 个 竹 阵 的 形式 与 三 角 型 的 差别 仅仅 是 : 
对 应 的 。 个 2 阶 方 阵 X, 下 次 对 第 线 上 有 个 非 零 元 素 。 我 们 进 

一 步 证 明 及 可 以 是 正 交 算 阵 ， 
证 明 的 方法 类 似 于 第 一 章 $ 42，5 47 的 非 西 变换 和 西 变换 约 
化 第 阵 为 三 角 型 的 方法 。 这 里 的 特点 是 引进 了 复 共 辆 特征 值 ， 参 
由 第 一 章 的 证 法 ,由 归纳 法 可 知 ， 我 们 仅 需 证 明 存 在 矩阵 成 使 得 
已 4 下 :一 时 (2.2) 

ja 

证 明 如 下 ， 令 a 士 六 是 对 应 特征 值 jz 的 特征 向 量 . 显 
然 ， 与 刀 线 性 无 关 , 否 则 它们 只 能 对 应 实 特征 信 ， 现 在 我 们 有 


hn 


西 
4[x 一 [和 | | 一 [ma jnlh. 《2.3) 


一 和 思 
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假定 我 们 能 找到 一 个 非 奇异 矩阵 已 使 得 


Vi 
Hl i 1%] 一 各 (2.4) 
[od 
其 中 VV, 是 2 Xx 2 非 奇异 矩阵 。 于 是 从 (2.3) 得 到 
有 LE io 一 下 [六 ]4， (2.5) 
从 而 
了 pi 
aa [| -| Ga 
O O 
因此 ,如 果 令 ， 
刚 
EAHr: ~ | 一 (27) 
014, 
等 式 (2.6) 给 出 
XV 一 Fe 一 0. (2.8) 


这 就 证 明了 9, 是 零 ,并 且 X, 相似 于 4 因而 有 特征 值 十 im. 由 
此 可 知 , 上 述 合 等 式 (2.4) 成 立 的 球 就 是 我 们 村 构造 的 . 

实际 上 ,构造 这 样 的 咏 可 以 用 实 的 稳定 的 初等 非 西 矩 阵 的 索 
积 。 也 可 以 用 实 的 平面 旋转 矩阵 或 实 的 初等 Hermite 矩阵 的 乘 
积 。 如 果 把 和 分 别 看 作 一 个 x X # 失 阵 的 第 一 列 ,第 二 列 
并 且 用 (Gauss) 主 元 消去 法 或 用 Givens 方法 或 Householder 方法 
使 矩阵 三 角 型 化 ,这 结论 是 很 明显 的 . 

不 管 是 哪 一 种 情况 ，V, 都 是 如 下 形式 ， 


x x1 
| | (2.9) 
0 x 
从 六 和 妃 的 线性 无 关 性 可 知 ,这 个 矩阵 是 非 奇异 的 . 


LR 算法 


3. Rutishauser 的 算法 以 矩阵 的 三 角 分 解 为 基础 (第 四 章 536). 
Rutishauser (1958) 记 


A=LR, (3.1) 


.505. 


其 中 工 是 单位 下 三 角 型 , R 是 上 三 角 型 。 为 了 容易 与 Rutishenser 


的 工 在 对 比 ,在 本 章 中 我 们 用 RR 代替 了 UU， 
假定 现在 形成 了 给 阵 4 的 某 个 相似 变换 工 -4 工 。 我 们 得 到 
LAL = LA(LR)L = RL. (3.2) 


因此 ,如 果 先 分 解 矩阵 4, 然后 把 因子 按 相 反 的 顺序 相 乘 ,就 得 到 
一 个 与 4 相似 的 矩阵 .在 LR 算法 中 , 这 个 过 程 要 反复 进行 。 现 
在 我 们 把 原 矩 阵 记 为 4,, 算法 便 由 下 式 
A LR RiaLs= 4, (3.3) 
确定 ,显然 4, 与 4 相似 ,因此 让 归纳 法 可 知 它 相似 于 44，Rvti- 
tauser 已 经 证 明 , 当 "一 oo 时 ,在 某 些 条 件 下 得 到 
入 
bh 


一 并 且 R do .| (3.4) 


x 


和 
4 在 证 明 这 个 结论 之 前 我 们 先 来 建立 逐次 迭代 之 间 的 关系 ， 
客 以 后 要 反复 使 用 ， 从 《3.3) 得 


A = Ladi (4.1) 
反复 应 用 这 个 结果 给 出 
A = LaLa LET LL Ls (4.2) 
或 了 《4.3) 
由 等 式 
7 一 和 一 RR RL 《4.4) 


定义 的 矩阵 7, 和 Us 分 别 是 单位 下 三 角 型 和 上 三 角 型 。 考虑 溢 积 
T 必 ,， 可 以 得 到 
TU 一 LL LR)R, :RR 
一 三 LAR RR 
= AsLiL2 LR RR (M4.3)) 
= AT (4.5) 
重复 应 用 上 述 结果 得 到 


» S06 


TU 1 {4.6) 
这 就 说 明 7 了 ,DU 构成 4 的 三 角 分 解 。 


人 4. 的 收效 性 证 明 


5. (4.6) 式 是 后 面 的 论证 中 作为 依据 的 基本 结果 。 我 们 利用 
它 来 证 明 ， 如 果 4, 的 特征 值 5 满足 关系 
a > 12| > > 1 (5.1) 
那么 结论 (3.4) 通 常 是 正确 的 。 在 给 出 正式 的 证 明之 前 ， 先 考虑 
一 个 三 阶 矩 阵 的 简单 情形 。 为 了 简明 起 见 ， 把 右 特征 向 量 和 矩阵 X 
表示 为 


E71 yi 名 
X=|r yy z |, {5.2) 
C23 yy 
它 的 逆 Y 记 为 
4 
XY -|e 5 el, (5.3) 
gs bb 6 
于 是 


对 
下 一 和 一 X| # |x- (5.4) 
对 


Miro 二 类 ye 2 
Mi xzaai 十 邓 yac 士 对 mei rb 十 对 5 十 相 2 
mg 十 对 yaei 十 大 a 4 二 对 Is53 十 肝 
Uwe 十 下 7ac + acs | 
对 2aci 二 WBYscs 十 对 ac 
民 然 7, 是 生 的 三 角 分 解 ; 因 此 7, 的 第 一 列 的 元 素 给 定 为 
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对 zacl t Be 十 对 mc 
《5.5) 


各 一 1， 
和 一 (对 zol +t By + 6) 
Ung 十 ye 十 a), (5.6) 
= (Unt B07 +t 0) 
(Ura tt YY + Hs). 
显然 , 若 mw 关 0， 则 
艇 一 茹 /mm 士 00a11 和 
srt ON), 《5.7) 
并 且 一 般 而 言 了， 的 元 素 总 是 趋向 于 在 X 的 三 角 分 解 中 所 得 到 的 
对 应 的 元 素 . 
关于 7 的 第 二 列 的 元 素 , 我 们 得 到 


甸 一 1 
留 一 (jap ~— fafa) /ffs — ffa) 
MY xys rp) by ab) + (5.8) 


(hh) xys — rp) (abs 一 oo2p0 + 
0 (a) + 
二 人 ( 芭 ) + ” 
这 里 需要 条 件 
(ai 一 qb ) (xys 一 zy 天 0 (5.9) 
从 (5.8) 看 出 ， 沟 的 极限 等 于 在 和 的 三 角 分 解 中 得 到 的 对 应 的 元 
素 。 因 此 ,我 们 已 证 实 : 如 果 


和 一 了 TD， {5.10) 
那么 只 要 me 关 0， 并 且 《x9 一 #4) (qb 一 6251) 关 0， 就 有 
了 一 (5.11) 


6. 在 上 述 简单 的 情形 中 , 我 们 业已 证 明 : 只 要 X 和 Y 的 前 主 
子 式 不 是 堆 ， 矩 阵 7, 趋 向 于 特征 向 量 矩 阵 民 的 三 角 分 解 得 到 的 单 
位 下 三 角 和 矩阵 ， 现 在 我 们 对 特征 值 各 不 相同 的 矩阵 证 明 这 个 结论 
通常 也 正确 ， 记 


TU,= 4'=8, (6.1) 
从 第 四 章 $ 19 指出 的 矩阵 三 角 因子 的 元 素 的 显 式 表达 式 得 到 ， 
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tf = det{ Bi) /det( Bin), (6.2) 
其 中 Bi 表示 中 的 前 主子 矩阵 ， B7 表示 用 了 的 第 了 行 相应 的 元 
素 代 替 Bi 的 第 了 行 的 元 素 形成 的 矩阵 ， 从 关系 式 


B=4:= Xdisg(t)Y {6.3) 
得 到 
1 2 Xin 
Xa X32 Xn 
Bi = : 


Fi Ti Ki 

sh i 
Myn My yy 
Ma ya yy 


x (6.4) 


yo 站 yrye 鸡 3 
由 《第 一 章 $ 15) 对 应 的 矩阵 定理 ，det( Bj) 等 于 (6.4) 右 边 的 两 
个 和 矩阵 的 对 应 的 i 行 的 子 式 的 乘积 之 和 ,因此 可 以 写 出 
入 一 2 的 or (Mpap op 5 
Er 65) 
其 中 x 如.z; 是 的 第 P,P;，…，Pi 列 和 第 1,2,…， i 一 1 及 
第 i 行 构成 的 i 行 子 式 ，y 名 wo 是 了 的 第 1,2,…。i 列 和 第 Pp 
Ps。 Pi 行 构 成 的 i 行 子 式 . 
只 要 对 应 的 系数 不 是 零 , 在 (6.5) 的 分 子 和 分 母 中 起 主要 作用 
的 项 是 带 有 〈12 1) 的 项 。 在 分 母 中 相应 的 项 是 
det (Xi) det YH) hha sh), (6.6) 
其 中 Xi 和 Y;; 是 i 阶 前 主子 矩阵 . 
假若 det(Xa) det(Yr) 不 是 零 ,我 们 得 到 
> LX) der(Ya) der(Xy), (6.7) 
Get(Xis) det(Yn) dat(Xn) 
这 就 证 明了 T,~> T， 这 里 
X=7U, (6.8) 
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从 《4.3) 和 (4.4) 得 
二 一 TridT TAT 2 UIXAXU™ 
一 Udag(l)U™, (6.9) 

这 证 明了 极限 4, 是 上 三 角 型 ， 其 对 角 元 是 4。 根据 关系 ,一 
Tc=i7， 和 等 式 (6.5), 用 初等 的 但 很 元 长 的 论证 可 以 证 明 

及 一 Da (> oo), (6.10) 
让 此 ， 利 用 关系 式 4, 一 LR 以 及 R, 趋 向 于 一 个 极限 的 事实 可 
推 福 出 


P= OY (> 0%) G>)). (6.11) 
因此 ,如 果 有 某 些 特征 值 分 隔 不 好 ，4, 收敛 于 三 角 型 就 慢 。 另 一 
个 ( 较 简单 ) 的 证 明 在 $ 32 给 出 。 但 这 黑 的 证 明 是 有 启发 性 的 。 
7. 在 建立 上 述 结论 的 时 候 ,或 明 或 暗 地 作 了 下 述 假定 : 
(iD 所 有 特征 值 的 绝对 值 不 同 、 注 意 , 4 可 以 是 复 的 ,但 不 是 
有 复 共 轿 特 征 值 的 实 和 矩阵 (这 种 情形 在 $9 讨论 ). 
(Ci 在 每 一 阶段 ， 三 角 分 解 都 是 可 能 的 、 但 容易 构造 一 些 矩 
阵 不 满足 这 个 条 件 ,并 且 它 在 别 的 方面 没有 什么 特殊 点 ， 例 如 


0 1 
4 -| | cn 
一 3 4 


个 这 矩阵 有 特征 值 1 和 3 但 不 存在 三 角 分 解 。 注 意 。 和 矩阵 稍 作 修 
改 ,例如 (4 十 四 这 个 矩阵 就 可 作 三 角 分 解 , 并 且 用 这 矩阵 来 讨论 
与 用 原 矩阵 讨论 是 一 样 的 . 
(ii) X 和 了 Y 的 所 有 前 主子 式 都 不 是 零 。 有 些 很 简单 的 矩阵 
就 满足 不 了 这 个 条 件 。 形 如 
AiO 
| 振 | (72) 


的 矩阵 给 出 一 些 最 明显 的 例子 。 显 然 ,在 每 一 阶段 * 它 保持 这 形式 
不 变 . 矩阵 丸和 发 有 效 地 被 独立 处 理 。 在 其 极限 矩阵 中 。 左 上 
角 和 右 下 角 分 别 包含 4 和 4 的 特征 值 ， 这 与 它们 的 相对 大 小 天 
关 。 考察 2 x 2 矩阵 


«Sio* 


| | (7.3) 
B81 加 


是 有 益 的 ,其 中 151 > 1a|， 如 果 &; 都 是 零 , 在 LR 算法 中 ,这 个 
甜 阵 保持 不 变 , 其 极限 矩阵 的 特征 值 a 和 “不 按 正确 项 序 出 更. 特 


81 
| 1 0 | 它 的 第 一 个 主子 式 是 零 。 如 果 sr 都 不 是 


霉 , 而 是 小 量 ,特征 值 将 很 靠近 a 和 5， 其 极限 矩 降 的 特征 信 顺 序 
正确 ,但 是 收敛 得 慢 , 甚至 当 4 和 “不 是 特别 相近 时 也 如 此 。 
在 这 个 例子 中 , 当 s 一 8; 一 0 时 , 和 矩 降 的 两 部 分 是 明显 地 完 
全 "分离" 的 ， 引 进 小 量 s, 和 ss: 起 了 “ 弱 关 联 "的 效果 。 在 比较 复 
条 的 例子 中 ,开始 可 能 是 完全 分 离 的 , 即 对 某 个 上 有 
det( Xu)det(Yi) = 0, (7.4) 
但 在 ZR 过 程 中 的 伟人 误差 可 能 引进 弱 关 联 的 效果 。 


正定 Hermite 矩阵 


8. 当 4, 是 正定 Hermite 算 阵 时 ， 我 们 可 以 取消 $7 讨论 中 的 
限制 。 现 在 我 们 有 


A — Xdiag(hi) Ks, (8.1) 
其 中 xX 是 西 阵 , 2 是正 实 数 ， 因 此 ,等 式 (6.5) 变 为 
a) Dx hp lp bon), 
和 (82) 


现在 考虑 满足 条 件 x 好 ,sj 天 0 的 集合 PPPi, 设 99)… 4; 是 
集合 中 的 一 个 成 员 , 它 使 得 244,44,… "ae 不 小 于 其 他 任何 的 一 个 。 
显然 ,分 母 中 有 《244,14,.……14i)* 的 项 占 支配 地 位 ,至 于 分 子 , 从 我 
们 对 q191"…*4: 下 的 定义 可 知 ,不 可 能 存在 数量 级 大 于 (24,44,*…… 
14)' 的 项 ,实际 上 这 一 项 的 系数 还 可 能 是 零 。 因此 元 的 极限 可 
能 为 零 . 

我 们 希望 对 万 的 主子 式 不 作 件 么 假定 ,因此 不 能 断定 极限 7， 
是 从 X 的 三 角 分 解 得 到 的 矩阵 。 也 就 不 能 如 等 式 〈6.9) 那样 进行 


.Slle 


下 去 ,但 我 们 记 


Ti— Tos (8.3) 
则 得 到 
L,= TAT, -> ToT, = 1, {8.4) 
又 得 到 
A = THATi 一 TIT。 (8.5) 
于 是 4, 趋向 于 一 个 极限 ,比如 说 ,是 4。. 
现在 R= Lid ITeA Ts (8.6) 


因此 ， R, 趋向 于 与 4 的 相同 的 极限 ， 因 为 对 于 所 有 *，R, 都 是 
三 角 型 , 所 以 其 极限 必定 是 三 角 型 。 由 (8.5) 它 与 4 相似, 4, 的 
特征 值 必 然 按 某 种 次 序 在 其 对 角 线 上 出 现 。 注意 ， 重 特征 信 或 X 
的 某 些 前 主子 式 是 霍 对 证 明 都 没有 影响 ， 但 是 4: 不 一 定 按 绝 对 什 
递减 硕 序 出 现在 4u 的 对 和 角 线 上 。 此 外 ,在 下 述 情况 中 存在 一 个 
危险 , 当 准确 的 计算 会 得 到 一 个 极限 矩阵 时 ,其 特征 值 不 按 蚌 序 出 
现 , 舍 人 误差 的 影响 会 破坏 这 个 结果 , 可 能 造成 以 十 分 级 慢 的 速度 
效 化 于 一 个 特征 什 跨 序 出 现 的 三 角 型 矩阵 , 


复 共 轿 转 钙 值 


9. 当 4: 是 实 的 但 有 一 对 或 多 对 复 共 轿 特 征 值 时 , 显然 4, 不 
能 趋向 于 特征 信 分 布 在 对 角 线 上 的 三 角 型 矩阵 ,因为 所 有 4, 都 是 
实 的 ， 我 们 先 考 虑 有 一 对 复 共 轿 特征 值 ie-: 和 7- 的 情况 ,其 他 
的 特征 值 ,如 果 < 之 j。 则 1%| > [4|。 因 为 要 作 $6 的 推广 ,这 
里 也 假定 X 和 Y 没 有 一 个 前 主子 式 是 零 、 从 (6.5) 看 出 

> detXi /deX; (m1), (9.1) 
这 与 从 前 的 情况 一 禅 、 但 是 ， 对 于 i ~ m 一 1， 在 分 母 和 分 子 中 
都 存在 项 〔10 nlm- 和 〔 如 2 mw， 为 了 研究 这 
些 元 素 的 渐 近 狂 质 , 引进 一 些 简 化 符号 表示 X 和 Y 的 (mm 一 1) 阶 
子 式 。 我 们 记 
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Xu A Km 
Xn Xa Ka 
= det : : 2 四 
Kahl Km" Xm 
jy | 
Yu yu "Yims 


Co 一 et 和 Ya Ym 《9.2) 


yo um 
区 的 第 (m 一 1) 列 和 第 m 列 ，Y 的 第 (m 一 1) 行 和 第 m 行 是 复 共 
元 的 ,因此 有 


yoyo 


Ty XL Km) Tim 
Bd |: : | 
2 
Xi Ki im Xp 
yu A 
ys LA 
gm — dt |: : . (9.3) 
Psst Vrs Pm 
yy Vi pm 


现在 等 式 (6.5) 给 出 


~ Piqm_ :hla** 
png (hh 


ao + Pigm i hha mah) 
“hms) + Bndm hh 


hms ms) 
《9.4) 
当 “一 oo 时 , 它 不 收敛 ， 我 们 可 以 表示 (9.4) 为 形式 
~ Di + dp 
qasbmt + Go 


(9.5) 
由 此 可 得 


0 — tf ~ eB Busby) (Geiss 一 at 


{gribms 十 Gtipm) (esp + dpmt) 
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= Ppm-spi — pmpi), (9.6) 
因此 ，Tti 与 7， 的 第 (m 一 1) 列 的 差 与 分 量 为 名- 而 一 Pm-s 户 
的 固定 的 向 量 平 行 。 由 关于 pi;， 志 ，pm-， 和 pm-， 的 行列 式 表达 
式 ，Sylvester 定理 (例如 参见 Gantmacher 1959a，Vol.1) 给 出 


Pibi 一 到 -一 (xanax 了 ma (9.7) 
第 一 个 因子 与 i 无关, 又 因为 
Em 一 :地 jz， (9.8) 
我 们 可 得 
一 (9.9) 


10. 至 此 我 们 已 经 证 明 , 7, 的 列 除 了 第 (m 一 1) 列 外 全 都 趋 
向 于 某 个 极限 、 最 后 , Tm 和 了, 的 第 (wm 一 1) 列 的 差 是 7 的 第 
台 列 的 若干 倍 ， 于 是 从 Tm 二 TsLiwr 我 们 得 到 


» (10.1) 
La~ lo, 1 | 


其 中 元 素 8, 是 在 位 置 (mm，m 一 1). 从 关系 式 T 一 LT7' 君 
出 ，T7!' 的 所 有 行 除了 第 m 行 之 外 都 趋向 于 某 个 极限 ;最 后 ，T 尺 
和 77 的 第 m 行 的 差 是 (m 一 1) 行 的 一 9, 倍 .因此 ,除了 第 m 行 ， 
第 (m 一 1) 列 之 外 ，4i 一 7714:T， 趋向 于 一 个 极限 ， 现在 从 
4 的 三 角 分 解 得 到 wri, 并 和 且 从 Lon 的 极限 形式 看 出 ，4s+ 的 
下 次 对 角 元 案 除 了 (m，m 一 1) 位 置 上 的 元 素 外 都 趋向 于 零 , 或 
者 是 ds: 的 某 些 对 角 元 素 趋 于 无 穷 ， 从 (9. 和 知 4 以 -: 可 表示 为 
下 面 的 形式 ， 

a ~ Roos (sh + oy + pm)f cos(sO 十 cm- 十 pn。 (10.2) 
内 非 8 可 表示 为 4z/e，4 和 。 是 整数 ， 否 则 右边 的 表达 式 会 取 任 
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意 大 的 值 ;对 * 的 其 他 无 穷 多 种 取 值 ， 表 达 式 与 R 是 局 一 个 量 级 
的 . 因此 ,我 们 能 排除 4us 的 元 素 趋向 于 无 穷 的 可 能 性 。 

11. 我 们 的 分 析 可 以 明显 地 推广 并 得 到 如 下 结果 : 

设 4 是 一 个 实 矩 阵 ,特征 什 编 号 为 |4| 之 14| 之 … 之 [4l, 
用 % 表示 一 个 典型 的 特征 信 ，%._, 和 % 代表 复 共 统 对 ， 则 
4 二 -sw， 如果 

(GD 141 > 12sa|( 共 肛 对 除外 )， 

(ii) det(Xi)det (Yn) #0 (= 1,2,.°, 7), 

《还 ) 在 每 一 阶 眉 4, 都 可 以 三 角 分 解 ,那么 

(人 除了 a 以 外 多 一 0 (> 站， 

{b) oa 名 一 和 os 

(c) 除了 在 第 “ 行 和 第 〈e 一 1) 列 上 的 元 素 之 外 ，4 镶 (j > 
引 全 都 趋向 于 一 个 极限 。 


(d) 2 x 2 矩阵 
2 
| | 
不 收 伍 ,但 它们 的 特征 值 收 敛 于 对 应 的 和- 和 2， 

《e) 除了 第 (e 一 1) 列 外 , 元 索 六 趋向 于 (6.7) 给 出 的 极限 。 

注意 , LR 变换 有 效 地 约 化 实 和 矩阵 为 $ 2 讨论 的 那 种 型 式 。 

12. 现在 我 们 可 以 来 评论 LR 算法 作为 一 个 实用 的 技术 的 价 
值 。 从 下 述 理由 来 君 , 它 似 乎 不 是 很 有 前 途 的 . 

(i) 有 许多 短 阵 尽管 它们 的 特征 值 问题 是 良 态 的 ， 但 并 不 存 
在 三 角 分 解 ， 对 过 程 不 作 茶 些 修改 ，LR 算法 不 能 处 理 这 样 的 和 矩 
阵 、 还 有 更 多 类 型 的 矩阵 ， 其 三 角 分 解 是 数值 不 稳定 的 。 在 选 代 
过 程 中 ,数值 不 稳定 性 林 以 在 任何 一 步 发 生 , 它 使 得 计算 的 特征 值 
精度 遭受 严重 损失 。 

(i) 计算 量 大 ， 送 代 每 一 步 有 2 次 乘法 ,其 中 一 半 是 用 在 
三 角 化 , 另 一 半 用 在 右 弱 。 

(i) 下 次 对 角 线 元 素 是 否 收 俩 于 去, 依赖 于 比值 (1+71)， 
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如 果 特 征 值 分 晤 不 好 , 收 剑 是 很 慢 的 . 
显然 ,要 LR 算法 与 第 六 七 章 作 述 的 最 好 的 方法 竞争 必须 根 
据 上 述 意 见 进行 修改 。 


引进 交换 


13. 在 三 角 分 解 过 程 中 ， 在 必要 之 处 引进 交换 可 以 保持 数值 
稳定 性 ,在 用 相似 变换 约 化 矩阵 为 Hessenberg 型 时 也 使 用 过 这 样 
的 技术 .现在 我 们 对 LR 算法 作 类 似 的 修改 ， 

设 4 是 任意 一 个 矩阵 ， 在 第 四 章 5 21, 我 们 指出 过 存在 矩阵 
1nr 和 Ni, 使 得 

Ne NTs NilisrA = R, (13.1) 
其 中 N, 的 所 有 元 素 都 以 1 为 界 ， 用 
NT Ni Ton iy Na 
右 乘 R 就 完成 4 的 一 个 相似 变换 ,于 是 我 们 得 到 
NT_ooD Naloe Nl AT NT Ta Ni 


Tsay Na 
= RIwNT NT sn a Nas, (13.2) 
在 特殊 情况 下 不 需要 交换 ， 此 时 Isr 一 T(r 一 1, 2,…， 
2 一 1)， 在 (13.1) 中 ,4 前 面 的 矩阵 乘积 是 矩阵 L*， 它 使 得 
EL-4 一 及 或 者 等 价 地 4 一 LR; 在 这 种 情况 下 ， 等 式 (13.2) 右 
边 的 矩阵 是 RL。 因 此 ,对 LR 算法 作 如 下 的 修改 。 
在 每 一 步 用 带 交换 的 《Gsuss) 潢 去 法 把 矩阵 4, 约 化 为 上 三 
角 矩 阵 R.。 然后 用 约 化 时 使 用 的 因子 的 逆 右 乘 R,. 这 样 给 出 了 矩 
阵 4 计算 量 与 原来 的 过 程 一 样 。 
为 了 避免 令 人 厌烦 的 复杂 性 ， 我 们 分 析 41 与 4 的 关系 仅 局 
限于 ”一 4 的 情况 , 它 可 以 直接 推广 到 一 般 情 形 ， 我 们 有 
Nl NT Ni ds = Ri, 
A = {NslsyNsTe Nl} A Tw Ni TN Ty Ny!} 
一 {Nslss Na Ts ls) TN ToT Ts dsa Tir} A 
X Towlsy dss Ta NT Ta Tarls) 


oSi6. 


X ATaN5， (13.3) 
中 每 个 括号 内 的 项 均 为 [， 软 此 记 
fast = DB, Po 区， (13.4) 
其 中 新 和 应 具有 与 N, 和 NN, 相同 的 形式 ， 但 是 下 次 对 角 线 元 素 
次 序 被 改变 了 ,重新 组 合 因 子 后 ,(13.3) 给 出 
A 一 了 一 NrNrNs, 
A = Dylon ddadadyy. 《13.5) 
显然 ,也 是 单位 下 三 角 型 矩阵 , 3， 是 4 经 过 行 、 列 的 适当 置换 得 
到 的 、 如 果 我 们 记 


一 (13.6) 
其 中 已 是 一 个 置换 扼 阵 ,那么 
下 一 PdPI，Pd = ER, 
A — RPIL, 一 Lri(PAPYT)E,. (13.7) 


数值 例子 


14. 用 一 个 3 x 3 矩阵 作为 修正 过 程 的 一 个 简单 的 数值 例子 。 
Rutishauser 《1958) 曾 用 它 来 说 明 原 来 的 LR 过 程 不 收敛 、 乱 米 
4 与 对 应 的 4 及 答 隆 XX 和 Y 给 定 为 


1 一 1 1 5 
4=|4 6 一 1|， X=—2 
4 4 1 b=1 
0 一 1 —1 1 1 0 
X=|1 1 1 |,Y 一 0 1 -十 (14.1) 
1 0 1 一 1 一 1 1 


区 的 一 阶 前 主子 式 是 零 , 因 此 不 能 保证 原来 的 过 程 收 全 ,或 者 虽然 
收敛 但 是 极限 矩阵 中 特征 值 不 按 正 常 顺 序 出 现 ， 事实 上 ，, 在 这 种 
情况 下 , 用 $ 5 的 简单 分 析 可 以 证 实 7 的 元 素 发 散在 表 工 中 , 列 
出 了 原来 的 LR 过 程 前 三 步 得 到 的 结果 , 从 这 些 结果 立刻 得 到 4 
的 形式 . 

表 1 也 给 出 了 用 修正 过 程 三 步 得 到 的 结果 ， 第 一 步 被 详细 地 
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简单 的 LR 算法 
i Ls Ls 
1 1 1 
|: 1 | E 1 | 民 i | 
40.8 1 4 0.16 1 4 0.032 1 
入 4 4 
1 一 0.2 1 1 一 0.04 1 1 —0.008 1 
局 6 一 | 攻 6 -可 攻 在 一 125 | 
4 08 1 4 016 1 4 002 1 
攻 交 换 的 LR 算法 
第 一 步 的 详细 情况 


1 1 
T=2; N=|-0.25 1 ; == 1 日 
-1 0 1 0 一 08 下 


4 6 -1 6 32 -1 
R= —0.25 1.291;4, = RIeNTINs =| -1.25 1 1.25 


1 1 0.8 1 
第 二 步 和 第 三 : 网 


5.167 ‘3.040 —1-000 5.032 3.008 —1.000 
一 0.174 1.833 -1.042 一 0.033 1.968 1.008 


0.167 0.160 1.000 0.032 0.032 1.000 


5 3 -1 
“| 2 :| 

0 0 1 
列 出 了 。 在 4, 约 化 为 三 角 型 时 ,第 一 行 与 第 二 行 作 了 交换 ,这 是 
仅 有 的 一 次 交换 。 因 此 要 从 R, 得 到 4,, 首 先 交换 第 1 列 和 第 2 
列 ,然后 逐次 用 Ni' 和 Nz?! 坪 ， 在 后 面 的 各 步 不 需要 交换 ,我 们 有 
效 地 使 用 原来 的 LR 算法 。 和 矩阵 4, 很 决 收 化 于 上 三 角 型 ， 容 易 


看 出 ，4。 就 是 表 中 最 后 给 出 的 矩阵 。 引进 交换 不 但 得 到 收敛 性 
而 且 使 得 在 银 限 矩阵 中 特征 值 按 递 减 次 序 出 现 。 


修改 过 程 的 收效 性 
15. 我 们 给 出 的 LR 算法 收敛 性 证 明 不 能 报到 修正 过 程 去 。 
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然而 如 果 收 伍 于 上 三 角 型 的 情况 确实 发 生 ， 并 且 没有 一 个 特征 值 
是 零 , 显然 最 后 必定 不 要 交换 , 因为 下 次 对 角 元 素 趋 向 于 零 。 在 
$14 的 例子 中 这 当然 是 对 的 。 
但 我 们 确实 不 难 构造 出 一 个 简单 的 例子 ,使 原来 的 LR 过 程 
收敛 ,但 修正 过 程 却 不 收敛 。 例如 考虑 矩阵 
“| "| 4 3 % 一 一 2， (15.1) 
2 0 
我 们 得 到 
1 2 1 3 
4-| | 4-| |-^ (15.2) 
30 2 0 
在 4, 和 4. 的 约 化 中 都 需要 交换 。 因为 4;, 一 4， 这 过 程 是 构成 
一 个 循环 而 不 收 剑 。 另 一 方面 ,原来 的 LR 算法 收敛 ,特征 值 按 正 
常 次 序 出 现 . 
我 们 把 这 个 问题 放 在 $24, 并 且说 明 这 个 不 收敛 的 例子 并 不 像 
在 这 里 看 起 来 那么 严重 。 在 这 里 我 们 只 是 指出 , 数值 稳定 性 是 第 
一 位 的 ,修正 算法 一 定 要 采用 。 


初始 矩阵 的 预先 约 化 


15. 关于 $ 12 中 指出 的 第 二 个 问题 ,在 矩阵 4 只 有 很 少 零 元 
的 情况 下 , LR 算法 是 包含 着 不 可 容忍 的 巨大 的 工作 量 。 如 果 4， 
是 关于 LR 第 汉 不 变 的 某 和 过 于 , 那 人 工作 是 就 将 大 大 减少 . 

有 两 种 主要 型 式 满足 这 些 要 求 ,第 一 种 是 Hessenbesg 型 ， 它 
关于 修正 LR 算法 是 不 变 的 (因此 ,关于 原来 的 LR 算法 更 是 不 变 
的 .)， 第 二 种 是 中 心 线 为 主 对 角 线 的 带 型 , 它 对 于 原来 的 算法 ,型 
不 变 ,但 对 于 修正 的 算法 却 不 能 保持 原来 型 式 ; 根据 我 的 经 验 : 仅 
仅 对 于 这 黄种 类 型 的 矩阵 ，LR 算法 是 可 行 的 。 因 为 有 好 些 稳定 
的 方法 化 矩阵 为 上 Hessenberg 型 ,因此 这 不 存在 严重 的 局 限 。 


a Si9e 


上 Hessenberg 型 的 不 变性 


17. 我 们 首先 证 明 上 Hessenberg 型 关于 修正 算法 确实 是 不 变 
的 。 我 们 兽 讨 论 过 用 带 交 换 的 Ganss 消去 法 约 化 上 Hessenberg 型 
为 三 角 型 (第 四 章 5 33)。 在 约 化 的 " 沙 中 ， 选 取 的 主 元 素 仅 落 在 
第 行 与 第 《z 十 1 行 之 中 。 并 且 在 相关 的 矩阵 N 中 ( 除 单 位 对 
角 元 外 ) 非 零 元 是 落 在 位 置 (7 十 1:>)。 因 此 ,这 敌阵 Mr 是 Mr 
型 的 [第 一 章 $ 40(vi)]。 我 们 需要 证 明 给 定 为 
A = RD MRIsME -TsunM es (17.1) 
的 和 矩阵 4, 是 上 Hessenberg 型 . 这 里 ,ts 表示 Inrr 或 是 1, 这 
是 按照 约 化 为 三 角 列 的 第 + 步 是 否 作 了 交换 而 定 . 
用 归纳 法 证 明 。 假 设 矩 阵 
RInMa Ts Ma ln Mii 
的 前 + 一 1 列 是 上 Hessenberg 型 ,其 余部 分 是 三 角 型 。 作 为 一 个 
典型 。z 一 6，r 一 4， 其 形状 是 


jx x xlx X x 
7 一 1 X x xix x x 
x 


| 
x XIx x 
~ 一 |， (17.2) 
XIX x x 
n—r+l | xx 
i x 


下 一 步 是 用 Jr 右 慰 。 落 因 子 是 frret 那么 交换 第 * 列 和 第 
(+ 十 1) 列 ,否则 不 起 作用 。 所 得 的 矩阵 形 如 (9) 或 (b) 如 下 ; 
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x x xixxx 
r 一 14|X x xixxx 
x xlx x x 


-一 |， (17.3) 
XIX x x 
(一 | X X 
I x 
用 MM 总, 右 乘 的 效果 是 第 (r 十 1) 列 的 若干 倍加 到 第 列 , 得 到 
的 矩阵 形 如 〈e) 或 形 如 《d) 如 下 : 
X X x XIx x 
sllixxx xix x 
x x XIX x 
(0) = x xjx xp 
xjo X 
| x 
x x x xix x 
rllxxx xix : 
x x XIX x 
《一 x xix x (17.4) 
i 一 
xix x 
! x 


在 这 两 种 情况 下 , 矩阵 的 前 7 列 是 Hessenberg 型 ， 其 余部 分 是 三 
角 型 , 在 (c) 中 新 加 的 零 元 没有 什么 作用 。 这 就 建立 了 我 们 的 结 
果 。 


在 约 化 为 三 入 型 过 程 中 ,实质 上 有 二 过 次 委 法 ,在 右 乘 中 有 
于 字 次 ， 在 了 R 算 尘 中 一 个 完 装 的 一 步 要 邓 次 乘法 ,而 对 于 满 隆 
是 三 王 次 乘法 。 
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行 和 列 同时 运算 


18. Hessenberg 型 的 另 一 个 好 处 是 4, 的 约 化 和 右 切 可 以 结合 
起 来 ,对 于 一 台 有 两 级 存 贮 器 的 计算 机 ,第 * 步 迭 代 仅 需 从 外 存 传 
送 一 次 二 并 以 4 代替 。 为 了 这 样 作 ,需要 按 列 存 贮 4 

我 们 注意 到 在 约 化 中 仅 需 (4 一 1) 个 缚 子 wm (Cr 一 1 
2，…a 一 1)， 并 且 为 了 确定 前 " 个 乘 子 仅 需 和 矩阵 4 的 第 1 列 
到 第 + 列 。 我 们 就 一 个 典型 的 大 步 来 说 明 我 们 提出 的 技术 。 这 一 
步 开 始 时 第 1 列 到 (* 一 1) 列 已 被 计算 ,并 要 盖 在 外 存 中 省 的 对 
应 的 列 上 。 4wm 的 第 7 列 还 未 算 完 ,这 部 分 被 处 理 的 列 在 高 速 存 
聊 器 肉 。 元 素 wma,ms。……*，smmr-t 和 指示 在 这 一 步 计 算 这 些 元 
素 时 是 否 作 交 换 的 信息 也 在 高 速 存 贮 器 中 .现在 ， 典 型 的 一 步 可 
以 用 通常 的 记号 描述 如 下 : 

(GD 读 第 (r 十 1) 殉 到 高 速 在 喧 器 。 

对 卫队 1 到 + 执行 (和 (六)。 

(ii) 在 计算 mitw 之 前 按照 是 否 作 了 交换 , 对 wife 和 cirsey 
进行 交换 或 不 进行 。 

(证 ) 计算 airorr 一 marui giwtt 并 覆盖 在 aitums 上 。 完 成 
后 ,第 (r 十 1) 列 已 执行 了 约 化 4. 的 前 ” 行 所 包 仿 的 运算 . 

(iv) 若 amonml > srtaroal， 交 换 这 两 个 元 素 ， 然 后 计算 
patt 一 rturtifartintt 存 trtartt 并 记录 是 否 作 了 交换 。 用 
零 代 蔡 apo 

第 (r 十 1) 列 现在 是 三 角 型 矩阵 的 第 (r 十 1) 列 ,这 矩阵 是 在 独 
立地 完成 约 化 中 得 到 的 . 

(Y) 如 果 在 计算 mw 之 前 要 作 交 换 ,那么 ,交换 修改 后 的 第 
7 列 和 (r 十 1) 列 (它们 都 在 高 速 存 贮 器 )。 

(CD 加 mrrorX 第 (r 十 D 列 到 第 + 列 。 
当前 第 列 现在 是 4 的 第 r 列 ,可 以 记 在 外 存 。 

上 述 组 会 过 程 给 出 的 结果 与 原来 的 相间 ， 其 至 计 及 合 人 误差 
也 是 这 样 ,并 且 不 增加 运算 量 。 注意， 我 们 可 以 假定 4 的 下 次 对 
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角 元 arrur 没有 一 个 是 零 。 因 为 若 有 霉 苑 我 们 可 以 把 矩阵 分 为 
责 全 或 多 个 小 的 Hessenberg 型 矩阵 来 处 理 ， 因 此, 在 (iv) 步 分 母 
arurtl 是 非 零 的 ;因为 在 这 一 阶段 执行 除法 时 ,| arrovedj 大 于 原来 
的 1e+ravrs| 和 某 些 别 的 数 。 


收敛 的 加 速 


19. 虽然 预先 约 化 矩阵 为 Hessenberg 型 显著 地 减少 了 运算 量 ， 
但 修正 的 LR 算法 与 以 前 的 方法 相 比 还 是 不 经 济 的 。 除 非 我 们 能 
改善 其 收 收敛 率 。 

我 们 已 看 到 对 于 一 般 矩 阵 , 位 于 (i,j) (i > j) 上 的 元 素 棚 
赂 地 按照 (272) 趋向 于 零 。 对 于 Hessenberg 型 矩阵 , 仅 在 位 置 
(7 十 1，*)》 上 有 非 零 次 对 角 线 元 素 ， 现 在 考察 矩阵 (4 一 p1)。 
这 个 矩阵 有 特征 值 〈2 一 ), 并 且 至 少 是 对 于 原来 的 LR 技术 ， 
a 按 区 ie 一 了 /2s 一)}* 趋向 于 零 。 如果， 很 接近 je。 
元 素 < 纺 -: 就 很 快 缩小 。 因 此 , 用 (4, 一 好 ) 比 用 4, 运算 有 利得 
多 


注意 ,在 特殊 情况 下 , ”等 于 4。, 如 果 修 正 过程 被 准确 的 计算 

的 行 的 话 ,那么 (x，s 一 1) 元素 在 一 次 送 代 之 后 就 会 变 为 零 ， 为 

此 ,可 以 研究 三 角 化 过 程 ,没有 一 个 主 元 (三 角 型 尺 的 对 角 线 元 素 ) 

可 能 是 零 , 除 非 是 最 后 一 个 ; 因为 在 约 化 时 , 主 元 不 是 s+ 就 是 

某 个 别 的 数 ,而 我 们 假定 w+xr 不 等 于 零 。 因 此 ,从 (4 一 ae7) 的 
行列 式 是 零 可 知 , 最 后 一 个 主 元 是 零 , 而 三 角 型 尺 的 形式 如 下 : 

XXX XX 

xxx 

xx 

x 


x 
x |， (19.10) 
x 
0 


它 的 最 后 一 行 全 是 零 . 限 着 的 右 乘 运算 仅仅 是 作 列 的 组 合 ,因此 这 
迭代 结束 时 ,矩阵 的 形式 是 
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(19.2) 


X X X X 
xx XXX 
oxx X X 


结合 原点 的 移动 


20. 对 于 LR 算法 的 改进 ,上 节 的 讨论 给 了 我 们 启发 。 在 第 

7 步 ,三 角 分 解 对 和 矩阵 《4, 一 心 7， 而 不 再 对 4, 进行 ,这 里 妃 是 
某 个 适当 的 值 。 因 此 ,我 们 得 到 的 矩阵 序列 的 定义 为 

As— hl = LR, RiLs t+ kl 一 A (20.1) 


我 们 有 
A RL thl =o 1 (4,— kDL, 
+ hl = LidsLs, (20.2) 
因此 ,这 些 矩 阵 4, 全 都 与 4 相似 。 事 实 上 , (20.2) 给 出 
4 一 了 4 一 工人 4 
一 工 7 站 LT4 (20.3) 
或 
了 由 一 4 {20.4) 
士 述 的 修正 公式 通常 称 为 带 原 点 移动 和 复原 的 LR， 因 为 在 每 一 
dR Rl A (205) 
这 给 出 
At= RLs= Li'(A, — sd)L, = Lr7'AsL— zl 
一 了 7 人工 站 4 一 se 一 sf 
一 LiL A LL — (zs + s)l. (20.6) 
继续 代 人 ,我 们 有 
A 了 
= Li LiL7[A: — (8+ zs 
tt ea), 《20.7) 
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因此 ，4uw 的 特征 值 与 44 的 差 是 六 4 


回 到 依 复 形式 ,我 们 有 
LiLs Le LR)R, :RR, 
= LTA kl)R RR 
= (4 — EDLL LR RR) 
一 (如一 DC 一直 DEL 
LisRs -RR 
C4 hI ka) hl), (20.8) 
因此 记 
T= Lib Ls, Uo RR,R, (20.9) 
我 们 看 到 ,7,0, 是 ]] 《41 一 1) 的 三 角 分 解 , (20.8) 的 因子 次 


pe 


序 不 起 什么 作用 。 这 个 结果 以 后 要 用 到 .。 

显然 ， 我 们 可 结合 应 用 原点 移动 和 交换 技术 。 矩阵 序列 4 
中 , 任 一 个 均 与 4, 相似 , 但 是 我 们 得 不 到 类 似 于 (20.8) 这 样 简单 
的 公式 。 


选择 原点 的 移动 


21. 实际 计算 中 ,我 们 的 沁 题 是 怎样 选择 序列 天 使 得 收敛 加 
快 ， 如 果 特 征 值 的 模 不 相等 ,那么 不 管 是 实 的 还 是 复 的 ,我 们 预料 
2 名 -4 名 分 别 趋向 于 零 和 4,。 因此 , 一 旦 a 吕 -， 变 小 或 有 迹 
象 表明 a 外 收 合 , 我 们 就 令 名 一 a 名。 实际 上 容易 证 明 , 当 <9。 
是 :数量 级 时 如果, 一 a 如, 就 得 到 
agoD 一 O(a’), (21.1) 
一 个 有 代表 性 的 情况 , 当 s 一 6 时 , 《4 一 a 品 1) 的 形状 如 下 述 矩 
阵 (a) 所 示 。 
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xx xx xxxxxx 
xxxxxx | 
xxxxx xxxx 
(21.2) 
xxxx xxx 
xxx ab 
8 0 8 0 
(9 
xxxxx x 
xxxx x 
xxx x 
xx x 
e 5 
—bgfa 


现在 考察 用 带 交 换 的 Gavss 消去 法 约 化 (4, 一 a 名 1) 为 三 角 型 。 
当 约 化 仅 差 一 行 未 作 的 时 候 , 和 矩阵 是 (21.2) 中 (b) 才 示 的 形状 在 
第 (s 一 1) 行 中 的 元 素 < 不 是 小 量 ,除非 "总 碰巧 与 4; 的 (4 一 1) 
阶 前 主子 矩阵 有 特殊 关系 ， 比 如 这 子 和 矩阵 的 一 个 特征 值 正 是 “ 移 
动 " 量 - 亲 此， 在 景 后 一 步 不 必 作 变 染 于 是 
mont — Bfa, {21.3) 
三 角 型 的 形式 就 是 (21.2) 中 《c) 记 示 的 . 
现在 转 到 右 乃 , 当 我 们 用 除了 7- zw-: 之 外 的 全 部 因子 右 


乘 后 , 矩阵 将 是 如 下 的 (a) 或 (b) 的 形式 

(a) (b) 
xxxxxx XXXXX X 
XXX XXX XXXXX 关 
XXXX x XXX X x 

。，《21.4) 

X X X X X X X X 
a 0pb X 9 bb 
—bela 一 bj 
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它们 对 应 于 约 化 过 程 中 计算 ms-wr-: 之 前 作 了 交换 或 者 没 作 交 
换 ， 用 第 = 列 的 ws-: 倍加 到 第 = 一 1 列 ， 这 通常 不 需要 交换 ， 
这 样 完成 了 右 乘 。 最终, 矩阵 形 如 下 面 (a) 或 (b) 的 形式 。 


(a) 
X X X X x x 
xxxx x x 
X X X X X 
X X x x 
x bela Bb 
一 58210 —bela 
(b) 
X X X X X X 
X X X X X X 
X X X X x , (21.5) 
xx x x 
x (at be)fa [a 
一 6617 —bela 
因此 ,在 复原 移动 之 后 得 到 
6 一 a — befa, alty, =— —be/o, (21.6) 


因而 < 名 确实 收 化 ,并 且 a 是 @ 数量 级 ,这 正 是 我 们 所 期 望 的 
结果 。 注意 , 约 化 时 在 菜 些 苏 他 步 中 作 了 变 狠 产生 的 影响 很 小 


矩阵 降 阶 


22. 通常 ，ag-: 一 且 变 小 , 它 的 值 便 很 快 变 为 零 。 当 它 已 达 
到 运算 精度 可 忽略 时 ,我 们 可 以 把 它 作 零 处 理 , 而 a 名 当前 的 值 就 
是 一 个 特征 值 。 其 余 的 特征 值 是 (” 一 1) 阶 前 主子 矩阵 的 那些 特 
和 钙 值 , 这 个 矩阵 也 是 Hessenberg 型 ， 因 此 我 们 可 以 对 这 个 比 原 矩 
阵 低 一 阶 的 矩阵 继续 施行 同样 的 方法 。 因 为 我 们 希望 下 次 对 角 线 
元 趋向 于 零 ,这 时 xs。 ”可 能 已 经 相当 小 ,此 时 我 们 可 以 立刻 
令 如 等 于 open 
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对 阶 数 逐 渐 递减 的 矩阵 继续 施行 上 述 方法 ， 可 以 把 全 部 特征 
值 一 一 找到 。 对 于 每 一 个 特征 值 的 收敛 过 程 的 后 期 一 般 是 二 次 收 
敛 的。 此 外 ,我 们 可 以 预料 到 ， 当 计算 了 较 后 的 特征 值 时 ,已 经 有 
了 好 的 开始 值 。 

这 个 降 阶 方法 是 十 分 稳定 的 。 事 实 上 ， 特 征 值 只 有 对 于 下 次 
对 角 元 敏感 对 才 会 受到 严重 影响 。 由 于 我 们 假定 了 通常 初始 的 
Hessenberg 型 托 阵 4, 是 从 一 个 满 矩阵 4 约 化 来 的 ， 如 果 特 征 值 对 
于 41 的 下 次 对 角 元 的 微小 误差 敏感 ， 那 么 在 LR 算法 开始 之 前 旱 
已 损失 了 精度 。 附加 的 危险 仅仅 是 4, 的 条 件 可 能 变 环 。 这 个 问 
题 在 我 们 比较 LR 和 QR 算法 时 ,在 $47 中 再 作 评论 。 


关于 收 委 性 的 实际 经 验 


23. 我 们 已 试验 了 对 Hessenberg 型 矩阵 ,使 用 LR 算法 ( 带 
交换 的 )， 以 a 名 的 当前 值 作为 原点 移动 。 自然 ， 仅 仅 是 用 于 只 
有 实 特征 值 的 实 的 或 复 的 矩阵 。 显然 , 我 们 根本 不 清楚 应 该 在 什 
么 时 候 开始 采用 这 个 移动 值 。 我 们 研究 了 下 列 方法 的 效果 。 

(Qi) 在 每 一 阶段 都 移动 a 只 3; 

GD) 仅 当 11 一 < 品 /4 后 9 之 s 时 使 用 移动 ,其 中 是 某 个 容 
限 ( 即 当 a 已 经 "稳定 "时 使 用 移动 ); 

《ii) 仅 当 14 如 -| < m4 时 使 用 移动 ,其 中 4 也 是 某 个 
容 限 . 

通常 ,使 用 (i) 收敛 性 已 使 人 十 分 满意 ,并 且 这 意味 着 : 采用 


(GD,G6) 容 限 应 放宽 .总 之 ,方法 (ii) 取 。 一 寺 是 最 有 效 的 ,对 


大 部 分 作 过 试验 的 矩阵 ( 阶 数 介 于 5 与 32 之 间 ), 每 个 特征 值 平均 
选 代 次 数 为 5 次 左右 ， 通 常 后 一 些 的 特征 值 选 代 ! 次 或 2 次 就 得 
到 ， 可 是 ,我 们 遇 到 过 一 些 和 矩阵 ,使 用 (i)，(i) 或 (十 ) 都 不 收敛 。 
显然 ,这 是 事实 ,例如 : 2 x 2 矩阵 


a pb 
| | Ist, ce > jal (23.1) 
0 
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这 是 5 15 中 讨论 过 的 例子 。 如 果 采 用 带 交 换 的 工 R， 它 逐次 变 为 


se sa pb 

| | 和 和 | | Ca) 

b 0 0 
显然 ,对 于 一 切 *， 有 o 一 0， 而 且 选 定 所 有 的 一 a 名 是 没有 
意义 的 。 

因为 如 果 收效 ，“ 锅 _-， 趋 于 零 , 因此 也 试验 了 移动 值 ， 
~ 去 a 十 a 各， (23.3) 

这 个 移动 值 马 一 办。 当选 用 所 一 < 如 失败 时 ,这 个 简单 的 经 验 
方法 几乎 对 全 部 情形 都 收效 ， 可 是 ;有 些 特征 值 相 异 的 矩阵 ,即便 
是 用 上 这 些 改进 的 移动 技巧 也 还 是 不 收 你， 下 池 我 们 描述 一 种 业 
已 证 明 十 分 有 效 的 选择 移动 的 策略 。 


改进 的 移动 策略 


24， 改 进 移动 策略 的 一 个 启发 是 从 考察 有 复 共 郊 特征 值 的 实 
和 矩阵 得 来 的 。 这 种 情况 下 极限 矩阵 不 是 严格 的 上 三 角 型 。 如 果 模 
最 小 的 复 共 辑 特 征 值 对 是 〈1 土 za), 那么 , 选 代 的 矩阵 最 后 变 为 形 
如 (a) 的 形状 : 
(a) 《hb) 


x x xix x rx x x xix 
x x xlx x xxxxiIx 

x xix x xxx jx ， (24.1) 
加 < x x jx 
ix x x. 


其 中 右 下 角 2 x 2 矩阵 的 特征 值 趋 于 根 应 的 值 。 另 一 种 情况 , 若 
模 最 小 的 特征 值 有 实 值 +, 迭代 就 为 (24.1) 中 (b) 的 形式 ， 假 定 对 
上 述 两 种 情况 我 们 取 2 x 2 矩阵 的 特征 值 ,那么 在 情况 (a), 特征 
信 趋 于 1 士 i。 在 情况 (b), 较 小 的 特征 值 趋 于 4. 上 明确 这 一 点 后 ， 
我 们 暂时 不 讨论 复 共 罗 特 征 值 的 情况 。 

对 于 特征 值 是 实数 的 矩阵 ,我 们 建议 这 样 选 志 首先 计算 4 
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的 右 下 角 2 x 2 矩阵 的 特征 值 ， 如 果 特 征 值 是 复 共 胞 ,等 于 ps 十 
19,， 那么 取 区 一 p.。 如 果 是 实 的 等 于 名 和 4,， 那 么 当 | 产 一 
| 之 19 一品 | 时 , 取 克 一 六 否则 取 区 一 9 

如 有 果 原 矩阵 是 复 的 ， 那 么 通常 相应 的 2 x 2 矩阵 有 了 两 个 复 特 
征 值 p, 和 4, 我 们 再 比较 1p, 一 a 只 | 和 1g, 一 o 吕 | 来 决定 移动 值 、 

我 们 可 以 在 每 一 个 阶段 使 用 按 上 述 方法 决定 的 移动 值 ， 也 可 
以 等 到 这 种 移动 已 显示 某 种 收敛 的 迹象 时 使 用 。 实际 上 , 选 代 过 
程 对 这 种 选 法 反映 并 不 灵敏 。 当 准则 


fh 一 11 < 二 (24.2) 


满足 时 , 立刻 把 按 上 述 办 法 指定 的 如 作为 移动 。 则 可 获得 最 好 结 
果 . 

现 已 证 明 这 种 技术 平均 收敛 率 是 非常 高 的 。 在 复 矩 阵 中 已 普 
遍 使 用 。 和 值得 注意 的 是 , (23.1) 用 这 种 移动 选择 法 , (23.1) 的 矩阵 
一 次 移 代 就 政 敛 。 因为 这 时 相应 2 xX 2 矩阵 是 满 的 , 这 是 不 足 为 
奇 的 ,但 它 瞳 示 着 。 这 种 移动 选择 法 是 具有 较 优 的 特性 的 。 


复 共 辑 特 征 值 


25. 现在 我 们 回 到 最 小 特征 值 是 一 对 共 斩 复数 的 情况 ， 我 们 
希望 最 后 2 x 2 矩阵 的 特征 值 将 逼近 这 一 共 乞 对 .假设 在 某 阶 段 
中 ,这 抵 阵 的 特征 值 是 p 士 好 。 如 果 先 用 移动 一季， 后 用 移动 


了 十 iq9, 作 了 两 步 原来 的 LR 算法 ,这 当然 包含 着 复数 运算 ,但 是 
我 们 现在 要 证 明 ， 当 计算 是 准确 地 执行 时 得 到 的 第 二 个 矩阵 是 实 
的 。 记 三 个 相关 的 矩阵 为 41, 4;，4，， 我 们 有 
A — pig) = LR, Rit (一 条) 一 4， 
A — (p+ ig)l = LR RL (p+ iq)1 = A:. 
应 用 (20.8) 的 结果 ,我 们 得 到 
LlaRiRi = [A — (Pp—ig)I][A ~ (p+ ig)1]. (25.2) 
显然 , 右边 是 实 的 。 现在 只 要 这 个 实 矩 阵 是 非 奇 异 的 , 亦 到 只 要 
? 土 i9 不 是 4, 的 准确 的 特征 信 ， 那 么 如 果 它 的 三 角 分 解 存在 的 
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(25.1) 


话 ， 它 是 唯一 的 ， 其 三 角 型 因子 显然 也 是 实 的 。 (25.2) 式 表明 
LL 和 RR， 确实 是 三 角 型 因子 , 因此 ,LiL 必定 是 实 的 。 又 因 
为 
As = (LL) AL Ls 《25.3) 
所 以 人 也 是 实 的 . 
我 们 可 以 想像 ， 如 果 执 行 了 LR 算法 这 两 步 ,计算 的 甜 阵 4， 
的 虚数 部 分 是 微不足道 的 ,可 以 取 为 实 值 、 可 是 ,实际 上 并 不 是 这 
样 ,时常 发 现 最 后 的 矩阵 有 根 当 显 著 的 虚 部 。 这 个 方法 是 数值 稳 
定 的 ， 计 算 的 矩阵 4, 的 特征 值 逼近 4 的 特征 值 (除非 4, 的 特征 
值 是 病态 的 )， 但 正 像 以 前 经 常 看 到 的 。 并 不 保证 计算 所 得 到 的 短 


26. 为 了 看 到 这 是 如 何 发 生 的 ， 我 们 考 漆 (26.1) 中 的 2 X 2 矩 
阵 4,, 它 有 特征 和信 4 和 大 


[| 
4 一 3 由 一 » 
cd 0 1 

站 b 

{4 一 1) 一 | | (26.1) 

0 一 下 
如 果 用 移动 4 执行 一 步 LR 算法 , 那么 4; 是 如 (26.1) 式 中 表示 那 
样 ,而 (4 一 27) 在 第 一 列 有 两 个 零 元 。 因此; 它 的 三 角 分 解 不 是 
唯一 的 ， 于 是 使 用 移动 (4 十 8) 和 (X 十 加 ,其 中 上 是 小 量 , 那 么 ， 


6 b 
4 一 (1 十 5)7 一 | | (26.2) 
82 (2 CO— 7X)+ 8 
其 中 ss 和 5 与 6 是 同一 数量 级 的 。 如 果 计 算是 准确 的 , 那么 
4 将 是 实 的 。 但 8 和 很 小 的 误差 将 明 最 地 改变 4;， 通常 , 使 
用 七 位 数字 的 计算 机 ，4; 的 虚 部 的 大 小 是 2-'/Js。 这 是 不 能 忽略 
的 ,但 是 只 要 嫉 部 被 保留 ,特征 值 完 全 不 会 变 .这 里 ,使 用 准确 的 2 
和 7 仍然 是 有 启发 性 的 ,在 (26.1) 的 (4; 一 17) 三 角 分 解 中 ， 工 可 
取 为 
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1 0 
| | Q63) 
m1 


其 中 矣 是 任意 的 ， 最 后 矩阵 4， 是 


2+ mb sb 
| ] (26.4) 
mm[(1 一 1 一 mp] 1—mb 


它 对 于 一 切 m 值 准确 地 相似 干 4i。 但 它 不 是 实 和 矩阵， 除非 选择 加 
使 得 4 一 mb 是 实 的 以 准确 的 特征 值 作 移动 ， 用 准确 的 计算 得 
出 的 这 种 不 确定 性 ,对 应 于 在 实际 的 过 程 中 zm 值 是 较 差 的 情况 .这 
在 表 2 中 得 到 说 明 ， 


家 2 
0.31257 0.61425 二 特征 伪 0.36444 士 0.5615 生 
Am 
[0.51773 0.41631 | 移动 1 区 一 0.36142+0.561561 


0.00000 十 0.00004 0.61425 
4 
一 0.09903 — 0.00004 0.00004 + 1. 123081 
一 0.24983 ~ 0.100837 。 0.61425 
由 一 
”一 08 — 0.20167: 0.97871 4+ 0.10083i 


41 的 特征 值 是 0.36444 士 0.56154;， 使 用 的 移动 是 0.36442 士 
0.56156;。 在 (元 一 17) 的 第 一 列 中 两 个 元 素 都 很 小 , 但 相对 误差 
很 大 。 对 于 准确 计算 是 实 的 矩阵 外 有 了 与 实 部 相同 数量 级 的 虚 
部 ,尽管 此 如 :其 特征 值 与 4， 的 在 运算 粮 度 内 是 相同 的 。 此外， 
如 果 我 们 计算 如 的 特征 向 量 , 并 利用 计算 的 变换 来 确定 4, 的 特征 
高 量 , 所 得 的 向 量 是 4 的 相当 精确 的 特征 向 量 . 


修正 的 LR 算法 的 缺点 


27. 在 使 用 复 共 簿 移动 的 讨论 中 , 我 们 忽略 了 交换 ，。 通 常 ,如 
果 包 含 交换 ， 准 确 的 计算 也 不 能 保证 4; 是 实 的 。 然 而 ,如 果 交 换 
仅仅 在 会 变换 到 4 时 使 用 ,那么 用 $ 13 的 记号 可 得 
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P(A1 一 27) 一 ER RPIL,+ A = A;, 
A = LPAPDE,, A 一 和 ~ LRs, (27.1) 
Ra 十 hl = 4s, As = Li'dsb. 
因此 得 出 
LLRR,™— (A — UR, 一 (PE — LI)LR, 
= (PAPT — A)P(4, 一 27)。 (27.2) 
右边 右 冬 PF" 表明, 最 后 的 乘积 是 实 的 ,可 是 我 们 不 能 保证 4 到 4， 
不 需要 交换 ， 
即便 我 们 假定 没有 复 共 斩 零 志 〈 能 先 验 地 保证 这 样 的 状 砚 是 
罕见 的 ), 修 正 算法 仍然 面临 着 数值 稳定 性 方面 的 批评 。 如 第 四 章 
所 指出 的 ,即便 使 用 了 交换 ,三 角 分 解 的 稳定 性 也 不 是 无 条 件 地 得 
到 保证 的 。 甚至 假定 每 一 特征 值 用 不 着 四 次 以 二 的 迭代 , 那么 一 
个 50 阶 矩阵 就 要 迭代 二 百 次 ， 上 次 对 角 线 元 素 的 量 逐 汤 增 大 的 危 
哈 也 不 能 忽视 (对 角 元 趋向 于 特征 值 ， 下 次 对 角 元 趋向 于 零 }。 经 
验 表明 ,由 这 一 个 原因 使 精度 损失 并 不 是 少见 的 。 


QR 算法 


28. 依照 本 书 的 一 般 处 理 的 方式 ,自然 要 设法 用 初等 西 变换 去 
代替 修正 的 LR 算法 中 使 用 的 稳定 初等 变换 。 这 直接 引 向 Francis 
(1961) 的 9R 算法 。Francis 用 因子 分 解 为 西 矩 阵 9 与 上 三 角 
型 矩阵 RR 的 乘积 代替 三 角 分 解 . 

算法 被 定义 为 关系 : 

As= DR Am™— QF4,0, = QFQ,R,Q, ~ RiQ,, (28.1) 
现在 每 一 哈 眉 使 用 了 一 个 西 相似 变换 。 所 要 求 的 因子 分 解 在 第 四 
章 $46~$55 已 经 寺 论 过 ,并 证 明了 :车 4, 是 非 奇 异 的 ,这 因子 分 解 
实质 上 是 唯一 的 , 并 且 如 果 取 R, 的 对 角 元 为 正 实数 ,那么 它 的 确 
是 唯一 的 。 如 果 4, 是 实 的 ,那么 9, 和 R, 也 是 实 的 。 这 种 因子 分 
解 有 优点 ,4, 的 前 主子 式 为 零 ， 不 会 像 在 通常 的 LR 分 解 中 那样 
引起 过 程 中 凤 . 

尿 次 秋 代 满足 的 关系 类 似 于 LR 变换 导出 的 关系 。 我们 有 
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A = 042 一 QF QF A QQ 
一 《9 -QF 4,0,02° "17), (28.2) 
由 此 得 出 
02094400 (28.3) 
所 有 的 4, 都 西 相似 于 4,, 如 果 记 
QQ OP, RRR U,, (28.4) 


那么 
PU,— QQ (QR)R LR, 
由 《28.3) 
一 QO1: 1 OQ, AR » “RL 一 AQ1: » "QR » “Ri 
= PUT (28.5) 
因此 
PU,= A {28.6) 


这 样 就 证 明了 P, 和 忌 , 给 出 对 应 于 4{ 的 因子 分 解 。 如 果 取 上 三 
角 型 的 对 角 元 为 正 数 ,那么 因子 分 解 是 唯一 的 ; 如 果 Rs 是 这 样 定 
的 ,那么 台 也 如 此 确定 。 


QR 算法 的 收 生性 


29. 通常 ,和 矩阵 4 趋向 于 上 三 角 型 ， 它 不 需要 LR 算法 收 合 
必 不 可 少 的 那么 多 严格 条 件 .在 详细 讨论 收敛 性 之 前 ,我 们 先 令 述 
这 两 个 方法 的 收 分 性 之 间 的 一 个 小 的 差别 。 

若 4, 是 个 上 三 角 逢 降 , 那 么 用 LR 算法 ,我 们 有 二 1， 
Ri 一 4,， 因 此 对 于 所 有 s, 我 们 得 到 4, 一 41。 而 对 9R 算法 ,如 
果 我 们 取 定 ER， 的 对 角 元 是 正 数 ,那么 情 形 就 不 是 这 样 。 事 实 上 ， 
我 们 令 


ailexp(i0;), Do disg[exp(i0;)], (29.1) 
得 到 

4 一 DID4D，4 = DAD, 《29.2) 
因此 ,虽然 4 的 对 角 元 与 4 的 相同 ,但 上 次 对 角 元 素 乘 了 一 个 模 
为 1 的 复数 , 于 是 显然 我 们 不 能 期 望 4, 趋向 于 严格 的 极限 , 除非 
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所 有 4: 是 实 的 并 且 是 正 的 。 这 个 模 为 1 的 因子 是 不 重要 的 ， 如 
果 对 某 些 西 对 角 型 矩阵 忆 渐 近 地 成 立 4,, ~ D™*4,D， 我 们 就 说 
4“ 本 质 * 上 是 收敛 的 
像 $5 做 法 一 样 ; 我 们 首先 研究 3 x 3 托 隆 :其 特征 值 为 
lh > 1 > 151， 
使 得 4 有 (5.5) 的 形式 。 用 带 规 格 化 的 Schmidt 正 交 化 过 程 (第 
四 章 $ 54) 来 考虑 因子 分 解 是 方便 的 ，P, 的 第 一 列 是 平衡 后 的 第 
一 列 , 它 的 Euciid 范 数 为 1, 因 此 其 分 量 按 比例 为 
NMxig 十 Mysa 十 Mrias: Mrags + Ny02 十 T3224 
Aiva 十 Vyas Vsas. (29.3) 
假定 a, 是 非 零 ， 这 些 元 素 最 终 按 比例 为 :x:*， 如 果 规 定 所 有 
Ri 的 对 角 元 都 是 正 数 ,那么 P, 的 第 一 列 渐 近 地 为 如 下 形式 
CaflaD) lad), ,#0)1 
hab + nb + ed) (29.4) 
办 此， 它 是 “本质 上 ”收敛 于 由 矩阵 X 因子 分 解 所 得 的 西 甜 阵 的 第 
一 列 。 如 果 4 是 零 , 但 ea 不 是 零 , 那 么 P, 的 第 一 列 的 分 量 最 后 比 
例 为 7.:y2: 为 。 在 相应 的 LR 方法 中 有 类 似 的 现象 发 生 。 
注意 ,为 零 对 QR 算法 没有 影响 ,而 对 LR 算法 会 引起 发 散 。 
对 于 一 个 指定 的 :，LR 算法 因 MHz 十 ye: 十 Was 变 为 堆 
而 “意外 ”地 失败 ,而 在 8R 算法 中 没有 这 种 问题 ， 
我 们 可 以 继续 这 个 初等 分 析 去 了 解 P, 的 第 二 列 、 第 三 列 的 这 
种 渐 近 性 态 ,但 这 比 L R 算法 的 更 为 元 长 。 显 然 ,我 们 可 以 期 望 P， 
本 质 上 收敛 于 义 的 西 因子 。 


收 化 性 的 正式 证 明 


30. 现在 给 出 忆 的 本 质 收敛 性 的 正式 证 明 。 首 先 假定 4 的 特 
征 值 编号 满足 关系 
1 > 1 > > (30.1) 
因为 这 样 的 4, 必定 有 线性 初等 因子 ,我 们 可 写 为 
Ai— Xdiag(AIX-' = XD'Y, (30,2) 
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定义 矩阵 80, R,L, UU 为 
X= OR, Ym LU, (30.3) 
其 中 及 和 了 为 上 三 角 型 , 工 是 单位 下 三 角 型 ,2 是 西 和 矩阵 ， 它 们 都 
与 /无 关 。 从 X 可 知 ,RR 非 奇异 。 注意 , DR 分 解 总 是 存在 的 , 然 
而 的 三 角 分 解 仅 当 所 有 前 主子 式 非 零 时 才 存 在 。 我 们 有 
Ai = ORD'LU 一 OR(D'LD-) DU, (30.4) 
显然 ，D'LD- 是 单位 下 三 角 型 拭 阵 , 它 的 (i, 门 元 素 对 于 ;>> 了 
给 定 为 (4/1)', 因 此 我 们 可 写 为 
DLD-' 一 了 十 也。 其 中 当 -oo 时 EE 一 0 (30.5) 
等 式 (30.4) 给 出 
Ai =— QR( + EID'U 
~— Ql + RER-)RD'U 
一 00 十 FRDU, 其 中 当 s 一 吧 时 ， 

了 ,一 0. (30.6) 
现在 (7 十 F,) 可 以 因子 分 解 为 西 阵 ,和 上 三 角 型 阵 包 的 乘积 。 
办 F, 一 0, 6 和 名, 都 小 向 于 I， 因此 ,最 后 得 到 

Ai= (90,) (KRDU). {30.7) 
第 一 个 括号 括 起 来 的 因子 是 西 矩阵 ， 第 二 个 因子 是 上 三 角 型 。 只 
要 才 非 琳 蜡 , 它 因 子 分 解 为 这 冬 的 一 个 乘积 ,在 本 质 上 是 唯一 的 。 
P, 等 于 96,。 可 能 相差 右 乘 一 个 对 角 再 矩阵 。 因此 疡 在 本 质 上 收 
化 于 80， 如 果 我 们 规定 R, 的 对 角 元 是 正 的 ， 那 么 可 以 从 (30.7) 
找到 本 对 角 因 子 . 记 
路 一 1DI1D， 了 一 六 (D5D)， (30.8) 
其 中 D, 和 D, 是 西 对 角 甜 阵 , D7'U 有 正 的 对 角 元 素 (中, 和 R 已 经 
有 正 对 角 元 素 )。 从 《30.7) 我 们 得 到 
Ai— 06,D,DIL(D,DI) RK, RCDD) DICDU)],. (30.9) 
在 方 括号 内 的 矩阵 是 上 三 角 型 ,其 对 角 元 为 正 ; 斑 此 ,P, ~ 8D,Di， 
这 证 明 最 终 8, 变 为 Du。 
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特征 值 的 不 同 晨 序 


31. 上 面 的 证 明 表 明 , 只 要 Y 的 全 部 前 主子 式 都 不 是 零 , 我 们 
不 但 得 到 本 质 收 全 性 , 并 且 2 都 正确 地 按 显 序 出 现在 对 角 线 上 。 
对 于 矩阵 和 没有 类 似 的 跟 制 条 件 。 从 3 x 3 矩阵 来 看 ， 如 果 a， 
《 即 Y 的 第 一 个 前 主子 式 ) 是 零 ,P, 仍然 趋向 于 一 个 极限 。 现在 ， 
我 们 对 于 Y 的 一 些 前 主子 式 为 零 的 一 般 情况 建立 这 个 结果 . 

尽管 当 Y 的 一 个 主子 式 为 零 时 ,没有 三 角 分 解 ,但 总 存在 某 个 
置 次 矩阵 P， 使 得 PY 可 以 三 角 分 解 。 在 第 四 章 # 21 已 经 说 明 , 如 
何 用 选 主 元 的 办 法 去 决定 这 样 的 P。 利 用 Gauss 消去 法 ,在 每 一 阶 
段 中 选取 最 前 面 的 一 列 中 模 最 大 的 元 素 为 主 元 ， 现 在 假设 用 另 一 
种 办 法 ,在 第 ”阶段 ,从 位 置 (r, r)，(r 十 1, +),….,(n, +) 中 选 
第 一 个 非 零 元 素 为 主 元 ， 设 是 (rr) 元 素 , 并 把 行 安 排 为 这 样 的 
顺序 "rr 十 1 二 一 1 7 十 1 34。 于 是 我 们 最 后 
有 


PY 一 LD， G3L1) 
其 中 工 有 一 些 零 元 素 在 对 角 线 以 下 。 它 们 的 位 置 与 置换 矩阵 忆 有 
关 . 因为 Y 非 奇异 ， 因 此 每 一 阶段 的 主 元 一 定 不 是 零 ， 我 们 可 以 
写 出 

AMi~ XD'Y = KDPILU ~ XP™(PDPT)LU, (31.2) 
矩阵 PD'P' 是 对 角 阵 ,其 对 角 元 是 41, 按 不 同 的 顺序 出 现 , 而 XPr 
由 X 的 列 置换 得 到 ， 如 果 记 
由 KPT 一 CR，PDPT 一 Ds, (31.3) 

A{— QRDILU ~ QR(DILD5') DU. (31.4) 

因为 元 素 好 在 PD, 中 不 按 自然 顺序 册 现 ,似乎 DL.Dy' 不 会 再 趋向 
于 I. 可 是 ,如果 用 li， '…，W。 表示 D， 的 对 角 元 ， 那 么 
DLPDi ”的 (p,q) 元 窒 (? > 9) 是 (Us/4ie)'1so。 并且 对 Y 选 主 元 
的 方法 确保 当 za < is 时 ，lze 一 0， 因此, 我 们 可 得 DILLD;' 一 
I 十,, 其 中 当 : 一 00 时 ，E, 一 0。 所 以 ,矩阵 P, 本质 趋向 
于 XP" 因子 分 解 得 到 的 矩阵 0。 
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等 模 的 特征 值 


32. 现在 我 们 转向 4, 有 某 些 等 模特 征 舍 ， 但 全 部 初等 因子 都 
是 线性 的 情况 。 假定 Y 的 所 有 前 主子 式 不 为 零 , 因为 我 们 已 弄 清 
楚 它 们 是 零 的 影响 。 于 是 


者 一 XDLU。 (32.1) 
设 1 一 12 一 … 一 41， 其 他 的 所 有 特征 信 模 不 等 。 在 
D'LD-' 对 角 线 下 的 (1,7) 元 素 是 《2127)325。， 因 而 趋向 于 零 , 除 非 

zz>inm (32.2) 


但 此 时 它 保 持 模 敌 于 iy。 
当 所 有 等 模特 征 信和 是 相等 的 时 候 ,可 以 写 出 
DLD 一 工 十 已 (E10), (32.3) 
其 中 了 是 一 个 固定 的 单位 下 三 角 矩 阵 ， 它 除了 满足 关系 式 (32.2) 
的 (i, 站) 元素 之 外 等 于 7, 那些 (i,j) 元 素 等 于 性。 如 打 记 X 了 一 
QR, 就 得 到 
人 一 DORCT 十 了 DT 
— QU 十 RE RDRDTD 
一 0G + FJRPU (P, 一 0 
一 (896)(RRPT)， (32.4) 
其 中 信物 , 是 (1 十 P,) 的 因子 分 解 。 因 此 , 除了 通常 的 西 对 角 右 
乘 因 子 之 外 , P, 趋向 于 X 因子 分 解 得 到 的 矩阵 8。 注意 ,X 了 的 
列 是 4 的 独立 特征 向 量 组 ,因为 它 与 Xx 的 差别 仅仅 是 第 ? 列 到 第 
= 列 变 为 它们 本 身 的 组 合 。 因此 对 应 线性 初等 因子 的 重 特征 信 不 
影响 收效 性 。 
当 等 模 的 畦 征 信 并 不 相等 时 ,矩阵 了 跟 上 述 的 形式 相同 ， 但 
现在 下 次 对 角 线 的 非 零 元素 不 是 固定 的 .如果 
hr = Ih expli0)), 
那么 
bj = liexp[is(0; 一 9)]。 (32.5) 
除了 第 * 列 到 第 : 列 之 外 ,矩阵 XZ 是 固定 的 。 对 于 每 一 个 : 值 ， 
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这 些 列 出 X 的 对 应 的 列 的 线性 组 合 构成 。 所 以 , 在 XZ 的 CR 分 
解 中 ，8 的 所 有 列 除了 第 > 到 第 * 列 之 外 是 固定 的 ， 第 > 列 到 第 
+ 烈 由 XX 的 西 因 子 的 第 7 列 到 第 列 的 线性 组 合 构成 。 因此 , 除 
了 第 > 列 到 第 + 列 之 外 , P, 是 本 质 收敛 的 。 

最 重要 的 情况 是 有 实 的 和 复 的 共 力 特征 值 的 实 矩 阵 的 情况 。 
显然 , 像 $9，510 那样 ， 我 们 可 以 证 明 4, 本 质 趋向 于 上 三 角 型 矩 
阵 。 内 是 关联 每 一 个 复 共 轿 对 多 了 一 个 下 次 对 角 元 ， 每 个 这 样 的 
元 素 对 应 一 个 2 x 2 矩阵 , 它 位 于 对 角 线 上 ,其 特征 值 收敛 于 相应 
的 共 斩 对 。 

当 和 矩阵 有 个 等 寞 的 复 特征 值 , 4, 有 一 个 阶 矩 阵 在 对 角 线 
上 ， 其 特征 值 趋向 于 那 > 个 值 。 作 为 一 个 简单 的 例子 ， 考 虑 矩阵 
A 


0 
1 2 一 4o Rn 一 
4 一 (32.6) 
0 


~oo 


= RO.= A,, 


me 口 品 
ooor 


0 0 
它 有 特征 人 ciw(z 一 0, 1，2、 3)， 这 矩阵 是 关于 OR 算法 不 变 
的 ,因此 总 是 保持 着 4 X 4 矩阵 在 对 角 线 上 。 这 样 的 子 块 可 能 无 
靶 自 动 探测 出 来 ,尤其 是 我 们 事先 不 知道 它 的 大 小 时 。( 见 5 47。 
关于 原点 移 位 的 影响 ) 


LR 算法 的 另 一 个 证 明 


33. 我 们 扼要 叙述 上 面 的 证 明 LR 算法 的 方法 的 修改 形式 。 

当 为 互 不 相同 时 ,有 等 式 
Ai = XD'Y = LxUxD'LyUy, (33,1) 
其 中 LxUx 和 LyUy 是 XX 和 YY 的 三 角 分 解 。 存 在 性 要 求 X 和 Y 的 

前 主子 式 是 非 零 。 因 此 

A LxUx(D'LyD YD Uy = LrUx(l + EUy (E,—> 10) 
= Lx(l + FUxUy (F,—0), {33.2) 
对 于 足够 大 的 :, 矩阵 (I 十 Fi) 肯定 可 以 三 角 分 解 ,但 对 小 的 * 
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值 ， 分 解 可 能 不 存在 。 这 是 当 某 个 4, 的 主子 式 是 零 时 发 生 的 “ 偶 
然 "失败 的 情况 。 这 在 2R 算 法 中 是 不 会 遇 到 的 。 忽略 这 种 可 能 
性 , 我 们 看 到 按 84 中 的 记号 有 7 了, 一 Lx。 由 此 得 出 结论 : 4, 趋 
向 于 上 三 角 型 , 2 以 正确 的 显 序 出 现在 对 角 线 上 。 

如 果 有 一 个 (或 多 个 ) Y 的 前 主子 式 是 零 ， 总 存在 置换 矩阵 使 
得 PY 可 作 三 角 分 解 、 仍 用 LyUy 表示 ,我 们 得 到 

Ai = XDPILyUy = (XPT}HPD'PT) LyUYy. (33.3) 

如 果 XP 可 分 解 为 LxUx, 也 就 是 说 , 它 的 所 有 前 主子 式 非 零 , 那 
么 我 们 能 用 通常 的 办 法 证 明 T,~> 工 x 和 4 趋向 于 三 角 和 矩阵 ,其 
对 角 元 与 DP7 的 相同 。 

34， 重 特征 值 (对 应 线性 因子 ) 和 等 模特 征 值 的 处 理 类 似 于 
QR 算法 中 所 给 出 的 。 对 前 一 种 情况 , 当 XPTZ 可 三 角 分 解 时 ,过 
程 收敛 ,其 中 全 是 从 Y 的 下 三 角 因子 按 前 面 叙 述 的 方式 导出 的 一 
个 国定 短 阵 。 可 是 ,4, 是 对 称 矩阵 的 情况 特别 有 意义 ， 现 在 我 们 
得 到 X 一 Y7, 并且 如 果 我 们 选取 了 使 得 PY 可 三 角 分 解 ， 那 么 
XP' 也 可 以 三 角 分 解 ,因为 它 的 前 主子 式 与 PY 的 前 主子 式 是 相等 
的 , 即 都 是 非 零 . 

如 果 没 有 等 模特 征 值 ， 正巧 是 矩阵 XPT 需要 存在 三 角 分 解 ， 
而 且 看 起 来 好 像 民 BR 方法 一 定 收敛， 但 是 ,我 们 必须 记 住 ,虽然 对 
于 充分 大 的 s，(1 十 F,) 有 三 角 分 解 存在 ,可 是 对 某 个 特殊 的 * 
值 , 它 的 三 角 分 解 可 能 失败 。 因 此 ， 特 征 值 模 不 相等 的 对 称 短 阵 、 
准确 计算 一 定 收 化 ,除非 在 前 一 阶段 巡 到 候 然 的 失败 ， 

如 果 4, 是 对 称 正定 的 ， 我 们 能 证 明 过 程 一 定 收敛 而 不 管 是 否 
有 重 特征 值 。 《因为 全 部 特征 值 都 是 正 的 、 等 模 的 特征 值 必 然 相 
等 )。 容易 证 明 , 在 这 种 情况 下 , 任何 时 候 都 不 会 发 生 那 种 意外 失 
败 的 现象 ， 若 记 


PY = LLU, XPT = UILY, (34.1) 
那么 如 $32 所 述 , 要 LR 算法 收 化， 就 要 求 XP 有 三 角 分 解 存 
在 ,这 里 艺 是 从 工 中 册 去 对 角 线 以 下 除了 对 应 于 PD'PY 中 相等 的 
对 和 角 元 的 行 、 列 以 外 的 元 素 导 出 的 ， 现 在 得 到 
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(XP)Y 一 UILIY. (34.2) 
因此 ,必要 的 条 御 就 是 LT 应 该 可 以 三 角 分 解 , 即 它 的 所 有 前 主 
子 式 应 不 是 零 .应 用 有 关 的 矩阵 的 定理 , 从 也 与 上 ,的 关系 得 知 ， 
LIZ 的 每 一 个 前 主子 式 大 于 或 等 于 1, 这 就 证 明了 我 们 的 结论 ， 


QR 算法 的 实际 应 用 


35，9R 算法 的 一 步 是 要 分 解 4 为 9,R,。 从 悍 论 上 看 ,用 4， 
的 列 的 Schmidt 正 交 化 来 讨论 是 方便 的 ， 但 事实 上 正如 我 们 在 第 
四 章 $55 中 所 指出 的 ,通常 那样 所 产生 的 8， 不 是 正 交 的 。 这 时 
正 交 相似 变换 的 数值 稳定 性 要 受 损失 ， 在 实际 上 ， 我 们 常常 确定 
矩阵 9', 使 得 


OIA = Rs (35.1) 
而 不 去 确定 2, 本 身 。 和 抑 阵 87 不 是 定 出 其 显 式 形式 , 而 是 用 Giv- 
cns 或 Householder 三 角 化 方法 给 出 它 的 因子 分 解 形式 ， 或 是 平面 
旋转 的 乘积 ， 或 是 初等 Hermite 矩阵 的 胰 积 。 然 后 用 87 的 各 
因子 的 转 置 矩阵 逐次 右 乘 R, 得 到 R,8,， 在 第 三 章 $26,§35,645 
我 们 业已 证 明 , 计算 的 97 的 因子 的 冬 积 几乎 是 准确 正 交 的 ,并 且 
这 样 计算 的 R.8， 也 很 接近 于 用 计算 因子 准确 地 获得 的 矩阵 、 因 
此 ,我 们 可 以 证 明 , 计算 的 4,+; 有 逼近 计算 的 4 的 准确 的 正 交 变 换 ， 
(我 们 不 能 证 明 , 计算 的 4,++ 交 近 准确 执行 第 * 步 得 到 的 4; 的 变 
换 ， 确 实 , 一 般 说 来 ,这 是 不 成 立 的 ,) 
显然 ,工作 量 比 LR 变换 还 大 ，QR 算法 仅 当 4, 是 上 Hessen- 
berg 型 或 是 对 称 带 型 时 才 有 实用 价值 。 我 们 首先 考虑 上 Hessen 
berg 型 ,并 且 假 定 其 下 次 对 角 元 没有 一 个 是 零 ， 否 则 我 们 可 以 对 
低 阶 的 Hessenberg 型 矩阵 来 讨论 ， 
现在 ,我 们 证 明 Hessenberg 型 关于 OR 算法 是 不 变 的 。 首先 
考虑 Givens 方法 作 Hessenberg 矩阵 的 三 角 化 。 显 然 ， 这 是 用 平 
面 (1，2)，(2,3)，…，(2 一 1,4) 上 的 旋转 得 到 的 , 仅 需 2m 次 条 
法 .用 Householder 方法 代替 Givens 方法 没有 得 到 好 处 ,因为 三 
胃 化 的 每 一 大 步 只 有 一 个 元 素 要 化 为 零 ， 用 旋转 交换 的 转 置 右 乘 
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所 得 的 上 三 角 型 后 ,就 像 带 交换 的 LR 算法 那样 ，Hessenberg 型 又 
恢复 了 。QR 算法 的 一 步 有 4m 次 乘法 ,在 带 交 换 的 工 R 算法 中 只 
有 sf 次 ,但 是 对 8R 算法 其 收敛 性 是 建立 在 更 省 坚固 的 基础 上 
的 . 

正如 带 交换 的 LR 算法 那样 ,我 们 发 现 ,如 果 我 们 按 列 存 贮 每 
一 个 4,。 那 么 分 解 和 右 脓 可 以 结合 起 来 ,在 每 一 步 ,4， 从 外 存 读 
人 一 次 ,然后 被 4,+: 所 代替 ， 在 内 存 需要 4, 的 两 列 和 (一 1) 个 
转角 的 正弦 ,余弦 的 存 喧 空间 ,一 共 需 要 的 最 天 存 贮 量 约 44 个 字 ， 


原点 移动 


36. 原点 移动 有 或 者 没有 复原 的 方式 在 BR 算法 中 也 可 以 像 
LR 算法 一 样 引进 。 有 复原 的 过 程 定义 为 


机 一 人 DR， RO+thl = Am. (36.1) 
我 们 可 以 像 前 面 一 样 证 明 
4 一 《00 DT400 OQ {36.2) 


和 
(20 "QMNH Re RR) 
一 (4 一 可 站 (4 ~ (4 — kD). (36.3) 

这 些 原 点 移动 在 实际 计算 中 是 必需 的 . 当 4, 是 实 的 并 且 知 道 有 实 
特征 值 或 者 4;, 是 复 和 矩阵 时 ,我 们 可 以 完全 像 5 24 那样 选取 多. 在 
前 一 种 情况 ,所 有 运算 都 是 实 的 ， 已 经 证 明 ,使 用 根据 同一 原则 确 
定 的 位 移 , 89R 变换 的 迭代 次 数 比 修正 的 LR 方法 的 迭代 次 数 少 
得 多 。 

当 4 是 实 的 但 有 某 些 复 共 入 特 征 值 时 ,那么 ,一 般 而 言 ,在 选 
代 的 某 一 阶段 在 右 下 角 的 2 X 2 矩阵 将 含有 复 共 轧 特 征 值 4,X。 
如 果 我 们 使 用 位 移 1 和 X 作 QR 算法 两 步 , 那 么 这 两 步 完成 后 准 
确 的 计算 会 给 出 一 个 实 符 阵 ,虽然 中 间 的 矩阵 会 是 复 的 ,尽管 我 们 
现在 没有 在 $ 27 中 提 到 的 关于 交换 中 的 困难 , 但 在 实际 计算 中 我 
们 仍 可 发 现 最 后 的 矩阵 有 不 可 忽视 的 虚 部 ， 并 且 特 征 值 已 经 想 当 
准确 地 被 保持 着 。 Francis 设计 了 一 个 巧妙 地 结合 两 步 的 方法 , 它 
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可 以 完全 各 免 复数 运算 。 最 终 的 矩阵 必定 是 实 的 并 且 这 方法 与 标 
准 的 QR 算法 一 祥 稳定 ， 在 讨论 这 一 方法 之 前 ,我 们 先 描述 两 个 
别 的 策略 ,它们 使 计算 工作 最 大 大 节省 .这 两 个 策略 能 用 于 8R 和 
修正 的 LR 算法 ,而 对 修正 的 LR 算法 来 讨论 最 为 简单 . 


及 ,的 分 解 


37. 首先 ， 我 们 虽然 假定 4, 的 下 次 对 和 角 元 是 非 零 , 但 我 们 知 
道 通常 4, 的 某 些 下 次 对 角 元 趋向 于 堆 。 在 迭代 过 程 中 失 阵 4, 可 
能 有 一 个 或 几 个 十 分 小 的 下 次 对 角 元 。 如 果 这 样 的 元 素 是 充分 小 
的 ,我 们 可 以 认为 它 是 零 并 且 分 为 更 低 阶 的 一 些 Hessenberg 矩阵 
来 处 理 。 于 是 在 矩阵 


x x| 
x x! 
| 


中 , 若 = 是 充分 小 ,我 们 可 以 找 忆 的 特征 值 ,然后 再 找寻 的 特征 值 . 
注意 : C 没有 用 了 .我 们 指出 过 ,一 般 来 说 ， 原 Hessenberg 矩阵 
本 身 是 以 前 计算 得 来 的 ， 因 此 当 s 是 小 于 原 矩 阵 4, 的 元 素 中 的 误 
差 时 ,以 零 代 痊 = 不 会 带 来 什么 损失 。 2 了. 旭 。 数量 级 的 数 是 一 
个 适当 的 容 限 。 

因此 ,在 闪 代 的 每 ~ 踢 段 ,我们 检查 下 次 对 角 元 。 如 果 最 后 一 
个 可 忽略 的 下 次 对 角 元 是 在 位 置 (> 十 1，*)， 我 们 可 以 对 右 下 角 
的 (x 一 >) 阶 和 矩阵 继续 选 代 ， 直 到 这 个 小 矩阵 的 所 有 特征 值 都 找 
到 后 青 转 回 上 面 的 矩阵 若 > 一 ”一 1, 下 面 的 矩 降 是 一 阶 的 , 特 
征 信 就 得 到 。 这 时 我 们 可 以 去 掉 和 矩阵 的 最 后 一 行 , 一 列 , 即 矩阵 降 
了 一 阶 . 若 > 一 ” 一 2， 下 面 的 矩阵 是 2 阶 的 ， 我 们 可 解 二 次 方 
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程 得 到 它 的 特征 值 。 去 掉 最 后 的 二 行 、 二 列 , 和 矩阵 就 降低 二 阶 。 

38. 第 二 点 是 Francis (1961) 提出 的 方法 的 推广 ,考虑 在 位 置 
(r 十 1r) (r 十 2,r 十 1) 上 有 小 元 素 e 和 上 所 的 Hessenberg 矩 
阵 4.。 在 # 二 6,r 一 2 的 情况 ,这 和 矩阵 图 示 为 


xxixxxx 
1 
xxlxxxx 


-一 


x 
A~| ix xxXxx|=| 一 十 (38.1) 
6 X E 


X X 
X X X 
xx 


设 4 如 (38.1) 图 示 那 样 划 分 ,其 中 E 除 了 元 素 e 之 外 全 是 零 。 我 

们 证 明 , Ww 的 任 一 个 特征 值 也 是 矩阵 4' 的 特征 值 , 4’ 与 4 的 差 

别 仅仅 是 在 位 置 (r+ 二 2 >) 上 差 一 个 元 素 ss/ (arrare 一 所 ). 
事实 上 ,因为 (W 一 p1) 是 奇异 的 ,所 以 存在 非 零 向 曼 = 使 得 


x — pl1) = 0. (38.2) 
= 的 前 两 个 分 量 满足 关系 
《arrurrl 一 Pr 十 esx 一 0 《38.3) 
由 此 得 到 
eax 十 [giesf (arp — Flr — 0. (38.4) 


等 式 (38.2) 和 (38.4) 意 味 着 修改 后 的 矩阵 (4 一 p1) 的 最 后 (= 一 
7) 行 是 线性 相关 的 ,因此 “是 4 的 一 个 特征 值 。 若 

8iea/ (errirt 一 问 ) 
是 可 忽 覆 的 ， 那 么 闫 实际 上 就 是 4 的 特征 值 。 假若 sserts 一 4 
不 小 ,这 小 项 e 和 6; 说 明 丈 能 从 矩阵 的 其 余部 分 分 离 出 来 。 


数值 例子 


39. 这 个 效果 在 表 3 中 得 到 证 明 ， 一 个 5 阶 和 矩阵 在 位 置 (3.2) 
和 (4.3) 上 元 素 是 10…， 右 下 角 的 4 阶 和 矩阵 的 特征 值 是 上 ,py my 
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Ai， 只 有 Am 接近 es。 因此 ,我们 可 以 期 望 , 整个 矩阵 有 特征 值 +,， 
?ls 它们 与 向, 办 ,入 的 差别 是 10-* 数量 级 。 特征 值 x 与 m 的 
差别 约 是 10 数量 级 . 特征 值 1, 与 没有 匹配 对 象 , 当然 它们 
很 接近 3 阶 前 主子 算 阵 的 特征 值 。 


囊 3 

143121556 

3 7 

4-[ 二 |]- 1 G1 5.3 

了 Ho"2 5 7 

| 1 2 3 

! 4 1 

4 的 特征 值 W 的 特征 值 

二 一 0.46410 31623 名 一 一 0.46410 31621 
7 = 一 0.99999 85712 砷 一 一 0.99999 85714 
一 6,46412 31631 证 一 6.46412 31611 
一 6.00011 84534 Ho 5.99997 85724 


4.= 0.85410 48844 


实际 的 方法 


4 用工 R 算法 时 ,为 了 从 这 种 现象 中 取得 好 处 ,我 们 这 样 来 
执行 计算 ,每 迭代 一 次 , 我 们 选 定 一 个 原点 位 移 供 下 一 步 使 用 ， 
然后 ,对 于 ， 一 1,2,…, "一 1 检验 条 件 

ofr far /Cass 一 和 < 2-4 《40.0 
是 否 满足 ， 并 记 ? 为 满足 条 件 的 最 大 的 * 值 。 接著 执行 《4, 一 
,1) 的 带 交换 的 三 角 分 解 它 是 从 (P 士 1) 行 开始 而 不 再 从 第 一- 行 
开始 ， 这 在 位 置 (p 十 2，p) 上 引进 了 一 个 元 素 名， ono4:/ 
(eur 一 委 ， 第 一 步 开 始 不 用 交换 行列 , 根据 我 们 的 假定 这 个 
元 素 可 以 忽 路 。 这 样 的 部 分 三 角 分 解 完成 后 ,矩阵 对 "一 6, 一 
2 的 情况 ,形式 如 下 ; 
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XXX XXX X 

X xx XXX 

sl X X X X 
(40.2) 

—0xxx 

0 X X 


X 


0 


前 2 行 没有 被 修改 ;“ 一 "表示 变换 引进 的 可 忽略 的 元 素 ， 现 在 我 
们 把 相似 变换 作 完 ， 显然， 这 仅仅 涉及 对 包括 右上 角 和 矩阵 元 素 在 
内 的 第 (p 十 1) 列 到 第 = 列 的 运算 ,通常 ,条 件 (40.1) 在 第 5 步 
已 经 满足 , 那么 在 以 后 也 将 满足 。 

我 们 已 经 对 带 交 换 的 LR 方法 侵 述 了 上 述 计算 过 程 ， 它 可 以 
立刻 移植 到 8R 算法 上 。 事 实 上 ,可 以 采用 同样 的 准则 ,因为 当 这 
准则 满足 时 ,我 们 可 以 在 第 〈P + 1) 行 开 始 作 西 三角 分 解 。 第 一 
个 转角 是 小 的 ， 在 位 置 (p + 2，#p) 上 引进 揭 可 忽略 的 元 素 是 
Bez 并 19 欠 apr 一 天 旦 十 622。 

至 此 我 们 能 够 结合 上 述 两 种 技巧 利用 <s 女 w 可 忽略 和 


a qrn/ (Caget — %) 


可 忽略 而 获 益 。 
避免 复 共 胃 位 移 


抽 . 现在 我 们 可 以 考虑 有 复 苍 特征 值 的 实 短 阵 了 ， 当前 我 
们 仅 考虑 用 8R 算法 。 假定 在 第 * 步 右 下 角 二 阶 和 矩阵 的 特征 值 是 
,如 ,它们 可 能 是 实 的 ,也 可 能 是 复 共 孝 对 ， 不 论 是 哪 一 种 情况 ， 
让 我 们 考虑 用 位 移 如， 如 作 两 步 9R 算法 的 效果 。 为 方便 起 见 ， 
把 第 “个 矩阵 改 记 为 4 于 是 得 到 


A —Rl = OR, RO +t kl 4 (41.1) 
hi — bl ~ QR, RQi + bl = A;, {41.2) 
(QO) RR) 一 (4 — Rl) (4, ~— kl), (41.3) 
A ~ (0.90) 4A.0.0;. (41.4) 


假定 妨 ， 角 都 不 是 准确 的 特征 值 ,如 果 上 三 角 和 矩阵 的 对 角 元 是 正 
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的 ,那么 9R 分 解 是 唯一 的 
《4.13) 右 边 的 矩阵 总 是 实 的 ,因此 9,9, 是 实 的 ,是 从 (4, 一 
多 1) 《4, 一 已 1) 的 正 交 三 角 分 解 得 到 的 。 我 们 记 
QQ ~ 0, RRi— R, OR = (4 — hl) (A — bl), (41.5) 
等 式 (41.4) 说 明 实 矩阵 9, 使 得 
AQ = 04,. {41.6) 
现在 ,我 们 假定 用 其 它 方法 确定 一 个 正 交 和 矩阵 多, 它 的 第 一 列 
与 9 的 相同 ,并 且 使 得 


AG= 68, 《41.7) 
其 中 了 是 下 次 对 角 元 都 是 正 的 Hessenberg 型 矩阵 。 从 第 六 章 $ 7 
我 们 知道 ,这 样 的 人 必定 就 是 8, 而 了 必定 是 4;。 我 们 提出 , 在 任 
何 阶段 都 不 用 揽 运算 来 确定 名 和 8。 实际 上 , 我 们 通过 计算 第 一 
行 与 97 第 一 行 相同 且 使 得 、 


A = BOT {41.8) 
成 立 的 信 来 艇 到 这 一 点 ， 现 在 从 (41.5) 我 们 有 
OTA4, — D(A — bl) ~ R, (41.9) 


因此 ,07 是 化 (4, 一 1) (4 一 如 1) 为 上 三 角 型 的 正 交 拭 阵 ， 利 
用 Givens 方法 作 三 角 化 ， 97 是 二 n(n 一 1) 个 平面 旋转 Ri 的 对 
积 。 因 此 ,我 们 可 写 出 
OT 一 Ree Ra 《41.10) 
如 果 我 们 从 右边 R,, :开始 形成 这 乘积 ,我 们 发 现 07 的 第 一 行 是 
Ru … Rss Ra 的 第 一 行 ， 其 余 剩 下 的 旋转 再 乘 时 是 不 会 改变 这 
一 行 的 .现在 Rea，BRia,-…，Rus 完全 南 (4 一 起 站 (41 一 1) 
的 第 一 列 确定 , 因此 计算 不 涉及 这 甜 阵 的 其 它 列 。 这 个 第 一 列 仅 
由 三 个 元 素 组 成 ,如 果 记 为 x,， 六 ，z， 那 么 
和 一 (oa — (an ~— ha) 十 anan, 
一 她 十 agqn 一 4u( 十 向) 十 克 丰 3 
图 一 am 一 外 十 (om 一 和 ma， (4114) 
一 an(an 十 09 一 名 一 本 )。 


人 一 
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此 ,Riws Rus ee。 Re 都 是 单位 逢 阵 ， 市 由 xys 确定 的 
Ris 和 Rw 显然 是 实 的 ， 假 设 Rs 和 Ri 由 may 六 和 计算 得 到 ， 
然后 我 们 形成 短 降 C, 为 

RisRinA RTRs 一 Cl (41.12) 
在 第 六 章 $7 中 我 们 证 明了 对 于 任 一 个 实 短 阵 Ci。 存 在 一 个 正 


SICS1 = B, {41.13) 
其 中 是 上 Hessenberg 矩阵 。 这 个 矩阵 5, 能 用 Givens 方法 或 
Honsehoider 的 方法 确定 。 轩 此 


(STRisR12) A RTsRIE,s $,) = 8B. (41.14) 
如 果 我 们 记 (STRisRiw) 一 07， 那么 从 (41.14) 有 
OTA = BOT, (41.15) 


因为 中 的 第 一 行 是 of，57 的 第 一 行 与 RsRia 的 第 一 行 相同 ， 
而 我 们 已 证 明 RsR,s 的 第 一 行 与 27 的 第 一 行 相 同 。 关 此 。B 必 
定 是 矩阵 4;。 它 是 用 位 移 已 和 如 作 两 步 OR 得 到 的 矩阵 。 所 以 。 
我 们 有 了 一 个 导出 4; 的 方法 ,不 管 和 妃 是 否 是 复数 ,都 不 涉及 
复数 运算 . 

42, 现在 我 们 指出 ， 上 述 推导 出 的 结果 非常 有 效 。 在 计算 话 
转 Ra 和 Rs 时 。 用 到 的 乘法 次 数 与 > 无关。 计算 它们 以 后 ， 从 
(41.12) 可 以 计算 Cu 用 的 乘法 次 数 也 与 无关。 对 于 = 一 8 的 
情况 ，C: 的 形状 是 


C1 

Xx x x xx xx 

Xx x x x x x X 

xx x x x xxx 

x0x xx xx x 
x x x x x | 

x x x X 

X X X 

X X 
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x x 
X x Xx 


XIX XXX x 


(42.1) 


Sx XXX X 

XXX x X X 

XXX x x x x 

XXXXXX X X 

XXXXXX X X 
t 
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用 0 表示 的 元 素 什 消失 并 没有 多 大 好 处 。 C: 不 是 一 个 完全 的 
Hosscnberg 型 ,由 左 乘 , 右 乘 引 进 的 额外 的 非 零 元 出 现在 第 1 列 和 
第 2 列 . 现在 用 Givens 方法 化 Ci 为 Hessenberg 型 ,因为 Ci 已 
经 几乎 是 一 个 Hessenberg 型 ， 因 此 工作 量 比 起 C, 是 满 矩 阵 时 要 
少 得 多 。 

通常 (第 六 章 , 52) 有 (n 一 2) 步 ， 在 第 ” 步 中 在 第 * 列 产 生 
一 些 零 元 。 现在 我 们 说 明 在 第 + 步 开始 时 ，C, 除了 位 置 (> 十 2， 
7”) 和 (7 十 3,r) 有 非 零 元 之 外 是 Hessenberg 型 。(r 十 3, 7 十 1) 
元 素 是 零 ， 但 这 并 不 带 来 好 处 。 sn 一 8，+ 一 3 的 情况 图 示 如 
(42.1)。 假定 在 第 步 是 那个 样子 ， 我 们 用 在 (r 二 1, + 十 2)， 
{r 十 lyr 十 3) 平面 上 的 旋转 左 乘 消去 (42.1) 中 用 横 线 标明 的 两 
个 元 素 ， 这 左 乘 运 算 破 坏 了 (> 十 3，* ++ 1) 的 零 元 ,但 没有 引进 
其 它 的 新 的 非 零 元 。 接着 用 两 个 旋转 变换 的 转 置 右 脓 ， 先是 第 
人 十 1) 列 和 第 (r 十 2) 列 由 它们 的 线性 组 合 代替 ,然后 第 (r + 1) 
列 和 第 (r 二 3) 列 也 由 它们 的 线 福 组 合 代 兰 ， 在 (42.1) 中 , 我 们 
用 箭头 指出 在 第 步 中 C, 被 修改 的 行 和 列 。 现在 看 出 C,+: 的 形 
式 与 C, 完全 类 同 . 

我 们 已 叙述 4, 预 先 变 换 为 Cu 它 好 像 与 约 化 C, 需 要 的 运算 
是 不 同 的 。 实际 上 ， 如 果 4 前 面 另外 加 上 由 x ,zi 作 元 素 构 
成 的 一 列 ,用 C, 来 表示 这 个 增 广 和 矩阵 ,其 形式 为 
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XXXXXXXX 和 
Xxxxxxxx A 
sa 0xXxXxxxxxx 和 
c- x 
xxxx 
xxx 
xx 0 


那么 从 Cu 到 C, 的 步 邓 与 从 Cr 到 Crr: 是 完全 一 致 的 ,从 4 到 4 
有 8 个 缚 法 , 这 与 9R 算法 的 两 个 实 选 代 所 需 相 同 。 如 果 我 们 
真正 用 复位 移 心 和 心 执 行 9R 算法 两 步 需 要 的 工作 量 为 164m 个 
乘法 。 


用 初等 Hermite 空 换 的 双 步 QR 


43. 我 们 已 描述 使 用 Giveas 变换 的 双 步 9R, 因为 它 比较 微 
单 。 对 单个 位 移 技术 ，Householder 方法 没有 优越 性 ,但 对 于 双 位 
移 技术 却 有 相当 多 的 效益 。 


我 们 用 记号 P, 一 1 一 2wrw?, 其 中 


wr (0, 0 0, X，X，…… X). (43.1) 
rl 
我 们 说 明 能 用 下 述 方法 导出 4，。 首先 产生 一 个 初等 Hermite 抵 
隆 P, 使 得 
Per = ko, 其 中 好 一 (xb jos aa0 0 (43.2) 
显然 w, 仅 有 前 三 个 分 量 是 非 矢 . 
然后 ,我 们 计算 矩 隆 C, = P,4,p,， 其 形状 图 示 如 下 页 ， 它 与 
用 平面 旋转 得 到 的 矩阵 C, 的 形式 几乎 相同 (参见 (42.1)), 仅 有 的 
差别 是 在 (4，2) 位 置 上 不 再 是 零 , 但 这 是 无 关 紧 要 的 
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XXXXxXXXxX XXX XXXXXXX X 
XXXXXx XXX X XXXXXX X X 
XXXXXX X X XXXXX X X 
(XXXXXXXX XXXXX X 
XXXX X 昌 XXXXXX| 

X X X x XXXXX X 

X X X X X x 

X X X X 

(43.3) 


接着 用 Householder 方法 化 矩阵 C, 为 Hessenberg 型 (第 六 
章 43)。 这 个 运算 包含 用 矩阵 P,，P,,.……，P。-: 逐次 作 左 乘 和 右 
乘 。 所 得 到 的 Hessenberg 矩阵 B 是 

Po PPAIPP Po 一 再 {43.4) 

Ps a.…P 的 第 一 列 与 Pi 的 相同 ,而 P 的 第 一 列 又 与 使 (4 一 《1) 
(4 一 1) 三 角 化 的 正 交 短 阵 的 第 一 列 相同 。 因 此 8 就 是 4 

现在 我 们 阐明 用 P, 左 莱 以 前 ,当前 的 逢 阵 C，。 对 于 ”一 8， 
* 一 4 的 情况 是 形 如 (43.3) 图 示 的 形式 ， 事 实 上 ， 假 定 C,-, 是 这 
样 ,那么 在 第 (7 一 1) 列 仅 有 二 个 元 素 要 出 P 消去 ,因此 对 应 的 
ws 仅仅 第 r，r + 1，r 十 2 这 三 个 元 素 是 非 零 元 ， 用 P, 左 条 和 
右 乘 是 第 r, 十 1，* 十 2 行 、 列 由 它们 自己 的 线性 组 合 所 代替 。 
并 消去 (+ + Dr 一 1) 和 (r 十 2,7 一 1) 元 素 的 过 程 。 这 个 矩阵 
Ci 与 C,, 的 形式 相同 。 又 因为 C, 是 我 们 所 需要 的 形式 ， 这 就 建 
立 了 我 们 的 结论 。 像 5842 那样 ， 在 矩阵 4, 前 面 如 上 由 元 素 xa。 
ys a 组 成 的 额外 的 一 列 ， 就 能 把 最 初 的 变换 包含 在 绕 一 的 格式 
中 。 


计算 的 细节 
44, P, 的 非 霉 元 由 元 素 3，c 生 b 和 cy-: 决定, 这 里 
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用 zx.， ys 表示 这 些 元 素 ,以 前 是 用 =:，p， 2 表示 的 ，P; 的 最 简 
单 的 表示 式 已 在 第 五 章 $33 描述 过 。 它 给 定 为 


Pb,=— 1 — 2p,p7 /lp lB, 

C000, 0 ts vr 0 0), 

Bd 二) (44.1) 
v= (xFS,) 

21p i=2/1 + Rtv), 


其 中 的 符号 选取 要 使 得 
[xF5,) = ll| + 5, (44.2) 


这 个 计算 方法 保证 P, 的 正 交 人 性 达到 运算 精度 。 我 们 使 用 P, 的 形 
式 为 


已 一 工 一 各 (act )， (44.3) 


因为 它 利用 了 pp; 的 三 个 非 零 分 量 中 的 一 个 等 于 1 的 特点 。 在 这 
种 方式 下 ,从 4, 到 4 包含 的 乘法 量 仅仅 是 3。 


及 ,的 分 解 


45. 在 采用 双 步 算法 时 也 能 利用 $37，$ 38 描述 的 两 个 技巧 。 
如 果 在 任 一 阶段 某 个 下 次 对 角 元 对 运算 精度 来 说 是 零 ， 显 然 是 可 
以 利用 那 两 个 技巧 的 。 在 4, 有 两 个 相 邻 的 下 次 对 角 元 是 “小 ”的 
情况 ,修正 不 是 很 简单 的 。 如 果 a 总,， 和 a89,rtt 是 充分 小 , 我 们 
希望 从 Per 开始 变换 而 不 是 从 P。 类 似 于 《41.11)， 我 们 计算 
tps rts arkl 如 下 : 


rt 一 于 NT 

一 oprn( 和 十 名) 十 名和 (45.1) 
Ji arparti( earth 十 rpart? — % — ka), 
Bet = praortaArr2rtty 
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用 它们 和 通常 的 方式 确定 Pa。 对 一 7，z* 一 2 短 隆 Pm 和 有 4， 
给 定 如 下 ， 


:| 
已 一 | -| 
1 一 2 人 


xxlxxxxx 


wlX XXXX EE 


x 
x 
x 
xx x 


! xx 
其 中 用 了 es 和 8 着重 表示 wsur 和 or 是 小 的 ， 用 P,+ 左 秉 保 
持 前 > 行 不 变 。 在 (45.2) 中 用 EE 表示 的 部 分 仅 有 一 个 非 零 元 , 通 
常 在 左 胰 之 后 , 它 有 三 个 非 零 元 ,图 示 如 下 : 


x Xx 


x 
x 
x 
x 


x 
xj， (45,3) 
x 


# 的 第 r 十 1,r 十 2, 7 十 3 行 已 按照 一 般 的 方式 修改 。 我 们 要 
求 由 和 四 应 该 可 忽略 。 用 $44 的 记号 得 到 
T= 1— 61 + Bt vr), 
n= — 8 Cl TF tt 0), (45.4) 
P= —28w( + ws + p+), 
从 (45,1) 我 们 看 出 ，yr4 和 zm 都 有 因子 emmarrs 一 Ba， 但 通常 
zo 不 是 小 的 。 因此 ,wrtt 和 wr 都 有 因子 6, 并 且 和 加 有 办 
子 e165;， 如 果 是 充分 小 ,就 是 一 si。 不 必 准 确 地 计算 站 和 mm 
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计算 从 第 (+ 十 1) 行 开 始 的 适当 准则 是 
Jeg) t+ aral) /lel < 2 la, (45.5) 

注意 , es 的 符号 必须 改变 议 给 出 1. 

从 我 们 叙述 的 两 个 方法 ， 利 用 下 次 对 角 线 上 小 元 素 得 到 的 收 
益 常 常 是 很 大 的 . 但 是 , 值得 指出 的 是 : 我 们 不 应 该 认为 这 些 手 
眉 仅 仅 是 节省 了 迭 代 中 的 计算 量 。 如 果 下 次 对 角 元 是 非 零 , 约 化 
成 的 Hessenberg 型 是 唯一 的 ,并 且 当 有 一 个 下 次 对 角 元 是 可 忽略 
的 时 候 , 只 用 下 面 的 子 矩阵 是 重要 的 ， 当 它们 是 关联 的 ,就 意 昧 着 
矩阵 的 上 半 部 和 下 半 部 是 弱 耦 合 。 如 果 上 半 部 有 某 些 特征 值 小 于 
下 半 部 揭 特 征 值 , 那 么 如 果 我 们 用 原点 位 移 为 零 作 充分 多 次 选 代 ， 
上 半 部 的 小 特征 值 将 " 掉 ? 到 下 半 部 的 右 下 角 来 。 但 是 这 种 弱 耦 合 
的 情况 收敛 过 程 是 慢 的 。 应 用 我 们 已 叙述 的 技巧 避免 了 这 种 时 间 
的 浪费 ,但 缺点 是 找到 的 特征 值 不 能 按 绝 对 值 的 递增 次 序 出 现 。 


LR 的 双 位 移 技术 


46. 不 考虑 交换 ， 对 于 LR 算法 有 类 似 的 双 位 移 技 术 , 与 
《41.0 到 (41.4) 类 似 的 等 式 是 
LiLRR, 一 《4: 一 区 DC4 — hal), 
4 了 也; 一 LiLsAs, (46.1) 
令 LL 一 上，RR, 一 R, 得 到 
太一 〈4 一 起 站 (4 ~ hl), 
AL = LAs {46.2) 
我 们 利用 这 样 的 事实 * 即 如 果 了 是 一 个 单位 下 三 角 和 矩阵, 它 的 第 
一 列 与 工 的 相册 ,并 县 


AL = £8. (46.3) 

这 里 8 是 上 Hessenberg 型 ,那么 工 就 是 工 , 而 B 就 是 4 (第 六 章 

511)， 与 2R 的 情况 一 样 。 我 们 实际 找 2”! 的 因子 而 不 是 上 本 
身 . 

我 们 计算 (41 一 所 DJ 《4 一 名 1) 的 第 一 列 ,并 且 像 前 面 一 样 

它 仅 有 (41.11) 中 给 出 的 三 个 非 零 元 mn,yoz。， 然 后 确定 了 一 个 Y 
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类 型 的 初等 矩阵 , 它 把 这 一 列 化 为 。 的 某 个 倍数 。 显然 ，NT 的 
第 一 列 就 是 工 的 第 一 列 。 最 后 , 由 C, 一 N,AWNY* 计算 Cl， 并 且 
用 非 西 初等 矩阵 Na Ns,,-… ,和 N。-。( 第 六 章 $8) 化 它 为 Hessenberg 
和 矩阵 8B。 因此 


Na "NNANTINi! -Ni 一 日 (46.4) 


矩阵 Ni Na ,Nah 是 单位 下 三 角 和 矩阵 ， 其 第 一 列 与 Ni: 的 相 
局 ，Ni* 的 第 一 列 又 与 工 的 相同 。 由 此 , B 就 是 箱 阵 4,。 在 约 化 的 
第 + 阶 眉 ,当前 的 矩阵 与 (42.1) 图 示 的 Givens 约 化 的 对 应 阶段 形 

完全 相间 .因此 ,每 个 N, 除了 最 后 一 个 之 外 , 仅 有 两 个 非 零 元 
在 对 角 线 以 下 的 (> 十 1,+) 和 (r 十 2, 7) 位 置 , 与 9R 一 祥 , 最 
初 一 步 可 以 与 其 它 的 结合 起 来 ,总 乘法 量 是 2 夏 数量 级 . 

在 性 何 阶段 我 们 都 可 以 引入 交换 ， 即 用 N, 1 代替 每 一 个 
Ni 包括 N,， 现 在 这 方法 是 在 较 脆 弱 的 理论 基础 之 上 ， 通 常 交换 
连续 发 生 在 较 早 的 行 和 列 。 即 便 是 某 些 其 他 的 特征 值 几乎 被 找到 
也 是 如 此 。 尽 管 这 样 ,实际 计算 中 我 们 已 发 现 ,用 双 位 移 技术 进行 
计算 是 相当 满意 的 。 但 是 , 用 我 们 已 叙述 的 方法 检查 可 忽略 的 下 
次 对 角 元 和 相 邻 的 小 下 次 对 角 元 是 绝对 必要 的 。 


对 上 LR 算法 和 QR 算法 的 评述 


47. 现在 , 我 们 可 以 比较 LR 和 8R 算法 应 用 于 Hessenberg 
和 矩阵 时 的 相对 优 劣 ,我 们 认为 ,执行 这 个 西 变换 的 情况 比 以 前 面临 
选择 西 变换 的 场合 要 强 有 力 得 多 ， 带 有 交换 的 LR 算法 的 收 化 性 
是 不 够 满意 的 ， 并 且 需 要 的 变换 数量 非常 之 大 ， 这 可 能 使 得 矩阵 
的 条 件 逐 渐变 坏 ， 非 对 角 元 的 大 小 可 能 稳步 增加 。 另 一 方面 ， 对 
9R 算法 ， 用 第 三 章 $ 45 的 方法 容易 证 明 ，4, 准确 地 酉 相似 于 
(4 十 下, 其 中 ,是 小 的 例如 ,可 证 明 在 能 用 有 内 积累 加 的 浮 
点 运算 的 地 方 都 用 这 种 运算 , 则 有 上 Ess < 让 sn2" 咱 4s， 此 外 ， 
已 证 实 9R 需要 的 选 代 次 数 总 小 于 LR 的 ， 

用 右 下 角 2 X 2 矩阵 确定 位 移 ， 以 及 包括 检查 小 下 次 对 角 元 
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的 双 位 移 OR 算法 ,在 我 所 用 过 的 通用 程序 中 是 最 好 的 。 鉴 于 它 
的 重要 性 ,去 处 理 一 两 个 有 关 收 合 性 的 错误 概念 是 值得 的 . 

在 $32 中 我 们 已 经 指出 , 当 4, 有 "个 等 模特 征 值 时 ,如果 不 
用 位 移 ,那么 在 选 代 的 每 一 阶段 ,都 可 能 有 一 个 阶 的 方块 在 对 和 角 
线 上 。 这 一 点 可 能 给 我 们 一 个 印象 ,总 是 很 难 发 现 它 。 但 事实 上 ， 
一 旦 结合 原点 位 移 , 这 航 少 是 真 的。 例如 ,下 述 矩 阵 都 是 用 标准 的 
双 位 移 8R 方法 解 的 ， 


©) 
一 1 一 1 一 1 一 4 一 ! 
1 0 0 0 0 
1 0 0 0 
1 0 0 
1 0 


0 一 1 一 10 一 !t 

1 0 0 0 0 

1 00 0 

1 0 0 

1 0 

Ci) {iv) 

0000—1 090000—1 
10 0 0 0 1 0 oo 
100—1 100—1 
10 一 1 1 0 一 1 


6 


《47.1) 


虽然 矩阵 ( 芒 ,(i) 和 ( 知 ) 的 每 个 特征 值 的 模 都 是 1, 但 是 每 个 特征 
值 的 平均 选 代 次 数 都 小 于 3。 用 标准 的 方法 确定 原点 位 移 使 得 修 
改 后 的 矩阵 没有 等 模特 征 值 ， 因 而 不 再 有 困难 发 生 。 这 对 于 
(32.6) 的 矩阵 则 不 然 。 它 的 特征 方程 是 #* 十 1 一 0, 这 个 矩阵 关 
于 8R 是 不 变 的 :并 且 用 通常 的 方法 确定 的 位 移 是 两 个 零 ， 可 是 ， 
如 果 我 们 随便 取 一 个 位 移 作 一 次 选 代 就 会 收 剑 ， 更 进一步 ， 如 果 
人 十 1) 是 某 个 矩阵 特征 方程 的 因子 ， 这 并 不 表示 CR 算法 不 
能 分 离 这 因子 的 零点 ， 只 要 其 它 因 于 使 得 非 零 位 移 被 使 用 ， 收 全 
就 会 实现 。 第 二 个 矩阵 担 供 了 这 样 的 例子 , 特征 方程 是 
(十 ID) (2 十 1), 但 一 次 迭代 之 后 ,通常 的 方法 决定 了 非 零 的 位 
移 ， 在 迭代 次 数 总 夫 12 次 之 后 ,五 个 特征 值 全 都 准确 地 达到 十 进 
制 12 位 . 


多 重 转 征 信 


48, 现在 我 们 转 到 多 重 特征 值 ，$ 32 的 论述 证 明 , 初 等 因子 是 
线性 的 多 重 特征 值 ， 不 影响 收 全 速度， 有 时 这 是 制造 非议 并 引起 
下 述 的 论证 。 

设 和 矩阵 4, 有 初等 因子 (4 一 a), (4 一 oa) 和 (4 一 上 ,其 中 4 
和 ,接近 1 和 3, 又 假定 在 某 一 阶 器 4, 给 定 为 


537 


A 


3 1 2 
a 1 | 《48.1) 


Be8 1 


可 以 验证 , LR 算法 一 步 得 到 矩阵 为 
2 
does 3 3 . (48.2) 


《8R 算法 给 出 大 致 相同 的 结果 ) 明显 地 ，(3, 2) 元 京 不 满足 收 
敛 福 . 

上 述 论证 中 的 谬误 是 ”如果 4, 的 初等 因子 是 线性 的 ， 它 不 
会 产生 这 祥 的 4,.。(4 一 o1) 的 秩 必 定 是 1, 因 此 (2, 3) 元 素 必定 
满足 关系 (3 一 "as 一 251 一 0, 结果 ow 必定 接近 等 于 s。 假若 
考虑 到 4， 中 的 元 素 必定 存在 的 关系 就 会 发 现在 下 对 角 的 元 素 确 


实 每 次 迭代 缩小 于 倍 ， 使 用 位 移 给 出 更 高 的 收敛 率 (参见 854 对 


于 对 称 和 抵 阵 的 讨论 ). 
如 果 4 有 非 线性 初等 因子 ,那么 通常 LR 算法 不 能 收敛 于 上 
三 角 型 ,因此 抱 阵 
a 0 0 
i= | 1 9 0 
9 1 4 


关于 和 传统 的 LR 算法 是 不 变 的 ,并 且 当 lal > 1 时 即便 用 了 交换 
也 是 如 此 ，《 这 矩阵 是 下 三 角 型 1 这 一 点 对 设计 成 去 检测 上 三 角 
型 出 现 的 方法 没有 什么 意义 .) 

然而 ，8R 算法 给 出 收效 性 。 事实 上 ， 我 们 可 以 证 明 ， 对 于 
Jordan 型 是 (48.3) 的 4, 那 祥 的 任何 矩阵 都 收敛 事实 上 ,有 
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(48.3) 


( ) 一 人 人 
A XI 1 了 (48.4) 


2) (DT 


因此 若 Y 一 LU, 我 们 得 到 
1 


~ oor 


@ Je 人 1 ) ao 二 wel (1) a + hae a 
| Ow 
a 1 0 10 
— XPKU, 《48.5) 
现在 , 如果 我 们 记 
K, = LU,, (48.6) 


从 KK, 的 形式 显然 有 LL, 一 1. 因此 

省 一 XPLUU ~ XP(T + EUU, 其 中 E,—* 0. (48.7) 
这 表明 按 通常 的 方式 ， 在 9R 算法 中 羔 积 0,8,…9, 本 质 上 趋向 
于 XP 的 8R 因子 分 解 所 得 的 矩阵 .如 果 我 们 写 


XP ~ OR, (48.8) 
那么 
A OTAQ ~ OTXIX™O = RPTJPR™!, (48.9) 
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并 且 


a 10 
PP = | a 工 | (48.10) 
0 0 a 

这 证 明了 4, 趋 襄 于 一 个 上 三 角 和 矩阵 ， 

显然 ,这 个 论证 可 以 推广 到 任何 次 数 的 初等 因子 和 象 30~ 
432 那样 包括 4, 有 复合 的 Jordan 型 的 情况 。 

收敛 速度 取决 于 afs 趋 于 零 的 速率 。 显然 ， 如 果 “ 是 小 的 ， 
那么 极限 很 快 达 到 。 当 。 充分 小 时 , 对 《48.3) 的 矩阵 两 次 迭代 是 
足够 的 ， 实际 上 我 们 可 以 期 望 , 使 用 位 移 意 味 着 需要 迭代 的 次 数 
非常 少 ， 作 为 说 明 的 例子 ,我 们 取 如 下 的 矩阵 4,; 
一 5 一 9 一 7 一 2 

1 0 0 0 ， 


一 


1 0 
det{A1 — 11) = (4 + 1 + 2), (48.11) 

这 里 有 一 个 三 次 的 初等 因子 。 用 双 位 移 8R 算法 ,并 用 十 二 位 十 
进 制 有 效 数字 作 计 算 仅 需 11 次 从 代 . 当然 。 这 个 矩阵 是 病态 的 ， 
444 的 元 素 改 变 8 数量 级 ,特征 值 将 改变 sw 数量 级 ， 重 特征 信 有 
10 一 数量 级 的 误差 ， 而 单 特征 值 的 误差 为 102 数量 级 。 对 于 这 
个 计算 的 精度 , 我 们 必须 把 这 些 看 作 是 “最 好 的 可 能 "的 结果 。 对 
于 一 些 有 非 线 福 初 等 因子 的 大 算 阵 双 位 移 程 序 ， 可 能 比较 慢 地 到 
达 位 移 的 较 准确 的 值 ,同时 在 开头 收 伍 会 十 分 慢 。 

严格 地 说 ,我 们 的 上 Hessenberg 矩阵 永 不 会 有 对 应 于 线性 初 
等 因子 的 重 特 征 值 ,因为 我 们 假定 了 所 有 下 次 对 角 元 索 都 是 非 零 ， 
因而 对 于 任何 4 值 ,(4 一 17) 的 秩 是 ”一 1.” 重 特征 值 必定 对 应 
于 一 个 "次 的 初等 因子 。 可 是 ,如 第 五 章 §45 指出 的 ,存在 有 极 舍 
近 的 特征 信 的 矩阵 ,其 下 次 对 角 线 元 素 都 不 小 。 假定 小 扰动 不 会 
产生 非 线 性 初等 因子 ， 收 敛 性 是 十 分 像 初等 因子 是 线性 的 多 重 特 
征 值 的 情况 。 
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从 上 述 讨论 可 以 清楚 看 出 ,把 位 移 技术 结合 进去 ,人 们 可 以 期 
望 8R 对 几乎 所 有 知 阵 都 极其 有 效 ,我 们 的 经 验 也 证 实 了 这 是 完 
全 正确 的 、 


降 阶 法 的 转 殊 用 途 


49. 我 们 的 下 一 个 问题 最 好 是 通过 把 8R 过 程 主要 看 作 一 种 
降 阶 法 来 引进 . 如果 % 是 一 个 准确 的 特征 值 的 话 , 那么 对 (4, 一 
227) 作 一 步 准确 的 QR 过 程 就 会 产生 一 个 矩阵 , 其 最 后 一 行 是 零 ， 
而 且 我 们 可 以 降 阶 。 现 在 我 们 假定 有 一 个 4 的 值 , 它 准确 到 运算 
精度 ,执行 一 步 9R 后 我 们 能 否 立 刻 降 阶 呢 ? 

这 个 问题 的 答案 是 一 个 “ 否 " 字 。 事实 上 , 我 们 构造 了 一 个 十 
分 良 态 矩 阵 , 对 这 个 矩阵 在 位 移 复原 之 前 ,变换 后 的 矩阵 中 (a, 4) 
元 素 不 但 不 是 零 ， 而 且 是 整个 矩阵 中 最 大 的 元 素 1。 矩阵 Wi 便 
是 这 样 的 一 个 好 例子 。 在 第 五 章 $556 中 , 我 们 已 经 讨论 过 W5 一 
(4a 十 5)1 的 三 角 化 ,并 且 看 到 当 8 是 107 数量 级 时 , 三 角 型 的 最 
后 一 个 元 素 是 大 于 21 的 ， 

初 看 起 来 ,这 是 很 骂人 的 ,可 能 使 人 感到 要 怀疑 方法 的 数值 稳 
定性 可 是 这 种 不 安 是 没有 根据 的 。 算 法 的 变换 总 是 准确 地 相似 
于 一 个 与 原 抢 阵 很 接近 的 矩阵 。 因 而 能 保持 特征 值 。 如 果 我 用 同 
样 的 位 移 劝 续 迭 代 就 能 降 阶 。 在 实际 上 , 两 次 迭代 还 不 够 的 例子 
是 军 驳 的 。 鲍 如 ,对 和 矩阵 Wi 两 次 选 代 得 到 的 矩阵 , 其 (21.20) 和 
(21,21) 元 素 在 运算 精度 之 内 都 是 零 。 我 们 可 以 把 它 与 第 七 章 $ 53 
讨论 的 噬 阶 法 对 照 , 那 里 应 该 是 零 的 量 不 能 达到 零 是 致命 的 。 


对 称 矩 阵 


50. 适合 于 LR 和 8R 算法 的 另 一 类 矩阵 (参见 $ 35) 是 带 状 
对 称 算 阵 。 集 中 讨论 这 类 矩阵 之 前 ,我 们 先 考 虑 一 般 的 对 称 短 隆 . 
我 们 立刻 可 以 发 现 QR 算法 保持 其 对 称 性 ,因为 

41 — 0140， (50.1) 
但 LR 算法 通常 却 不 然 ,这 是 一 个 不 幸 ,因为 对 称 性 在 计算 上 会 得 
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到 很 大 的 节省 。 
若 4, 是 正定 的 ,可 用 对 称 的 平方 根 分 解 (第 四 章 5442) 来 修正 
工 R 算法 。 用 让 表示 所 得 抢 阵 ,我 们 有 
A LL LIL A = Lidil = LIA(LI'). (50.2) 
显然 包 是 对 称 的 ,并 因为 它 相似 于 4 因此 它 也 是 正定 的 。 因 
此 ,这 个 过 程 可 以 继续 下 去 ,并 可 证 明 


A= La LTA La Li 


LIAA(LID™: (LA)’, (50.3) 
并 且 
LLa LL 4 (50.4) 
或 
《开工 LE (50.5) 


在 第 四 章 $43, $44， 我 们 业已 看 到 。Cholesky 分 解 不 但 工作 量 减 
半 ,* 而 且 有 很 高 的 数值 稳定 性 ， 又 不 必 交 换行 列 ， 如果 4 不是 正 
定 的 ，Cholesky 分 解 导 致 复数 , 并 且 数 值 稳定 性 不 再 有 保证 ， 通 
常 4 甚至 不 是 Hermite 从 阵 (仅仅 是 复 对 称 ) ,当然 它 仍然 有 实 特 
征 值 ,因为 它 相 似 于 4,。 于 是 ,如 果 
1 1 12 
4-| | | 
1 0 i 


| (50.6) 
一 1 


上 民 算 法 与 QR 算法 的 关系 


天 ，QR 算法 和 Cholesky LR 算法 是 密切 相关 的 。 事实 上 ， 
我 们 有 


《09 °° QO) (Ren RR) 一 4 (51.1) 
因此 
(Ri RaRDTCO9 0) 00:0 ) RRR;) 
= (ADTAi = 全， (51.2) 
或 者 


(RPRDTCR RaRD 一 人 
但 由 《50.5) 得 
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《La ai (51.3) 
因此 ,我 们 有 4? 的 两 个 Cholesky 分 解 ,因为 它们 必定 相同 ,我 们 得 
到 


Li -Ly = (Ri RRI)T, (51.4) 
现在 (50.3) 给 出 
dn = (Lbare Lo) A La) 《515) 
而 从 定义 QR 算法 的 关系 式 我 们 得 到 


4 一 Ri RAR RD! 
= bao Ly A (LL Le) 
一 人 (51.6) 
因此 ,用 Cholesky .LR 第 (2: + 1) 次 得 到 的 矩阵 等 于 用 QR 第 
“4 了 次 得 到 的 矩阵 。《〈 这 个 结论 对 于 非 对 称 第 阵 不 成 立 , 但 这 
也 许 是 8R 的 更 高 效 的 表示 .) 
这 证 明 适 用 于 4 是 正定 矩阵 或 非 正 定 矩 阵 ( 只 要 不 是 奇异 的 。 
否则 女 的 三 角 分 解 不 唯一 )。 现在, 如果 4 是 实 的 ，8R 算法 总 
是 给 出 实 的 选 代 ， 因 此 Cholcsky LR 算法 对 人: 必定 给 出 实 的 
矩阵 ,甚至 A 是 复 的 也 是 如 此 ,例如 ,对 于 (50.6) 矩阵 有 


3 一 工 
~ 2 2 
4 一 1 1l- (51.7) 
2 一 
更 重要 的 一 点 是 对 QR 算法 ,2 范 数 、Eudid 范 数 都 不 变 ,并 旦 和 任 
家 4 


eee 10°C0.9877) 10-1C0.1000) 0 | 
= 
10°C0.9877) 10°C0.1471). 四 10"C0.9877)i 


加 104C0.9756) 10°C0.9756)2 10*C0.9877) 0 

“ = [ee ss 10*C0.9756) ] “ ~ 四 
网 0 10°C—0.6893)3 
由 | 10°—0.,4871). 


0.1473 -0.9877 
准确 的 和 一 
0.9877 一 0.0001 
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何 一 个 4, 都 没有 一 个 元 素 变 大 。 关 于 这 一 点 当 4 不 是 正定 时 ， 
Cholesky LR 算法 是 不 成 立 的 。 包 的 元 素 可 以 很 大 ,但 到 ,必定 
又 转 回 到 正常 大 小 。 在 表 4 中 给 出 一 个 不 稳定 例子 ， 在 这 例子 中 
14slls 远大 于 i4ills。 虽 然 计算 的 4 是 实 的 ， 但 其 特征 值 精度 受 
到 严重 损失 。 我 们 给 出 一 个 较 精确 的 名 用 来 作为 比较 。 


Cholesky LR 算法 的 收效 性 


52. 当 4, 是 正定 时 ,不 管 特征 值 性 质 如 何 , 乞 都 趋 向 于 对 角 
矩阵。 对 于 正定 矩阵 ,我 们 已 经 证 明 QR 算法 总 是 收敛 的 .由 于 
Cholesky LR 算法 与 OR 算法 关系 已 建立 ,前 者 的 收敛 性 就 被 保 
证 。 下 述 证 明 不 依赖 于 这 种 关系 。 

设 4w 和 Lo, 表示 外 和 二 的 前 主子 式 。 从 关系 勾 一 LLY 
得 到 


dn — (Luny, (52.D) 
另 一 方面 ， 从 关系 式 多 一 LTL， 和 有 关 的 矩阵 的 定理 ，4.,ws 
等 于 由 LI 的 前 + 行 及 L, 的 前 + 列 构 成 的 相应 的 > 阶 子 式 的 乘 
积 之 和 。 现 在 对 应 的 子 式 相等 ,因为 对 应 的 矩阵 是 互 为 转 置 的 . 因 
此 ，4rwts 由 平方 和 给 出 。 可 是 一 个 项 是 ,因此 

A > A (52.2) 
所 以 ， 每 个 么 前 主子 式 随 * 递增 ， 又 因 它们 显然 是 有 界 的 ， 因 
此 趋向 于 一 个 极限 。 由 此 立刻 可 得 4, 的 所 有 非 对 角 元 趋向 于 零 . 
由 类似 于 833,$34 的 论证 可 证 明 : 当 特征 值 相 异 并 且 极 限 的 对 角 
矩阵 的 特征 值 以 递减 次 序 出 现时 ， 黎 趋 于 零 ， 当 了 > 时， 以 
比率 (4/40) 起 向 于 零 ' 当 诗 > 了 时 ， 以 比率 〈2/27) 科 趋向 于 
堆 


当 算 法 应 用 于 相同 的 对 称 第 阵 时 ,比较 Cholesky LR 算法 与 
标准 的 LR 算法 是 有 意义 的 ,如 果 4, 一 21, 4 一 LR:， 那么 
假定 4, 非 奇 异 , 必 有 

Li= FD, R= Di!, (52.3) 
其 中 D, 是 某 个 对 角 和 矩阵 ， 因 此 ， 
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VIE, A = Rb = DEED 一 DT 和 Di、(52.4) 
类 似 地 ,如 果 


= bi, A 一 LR 一 DZD， (52.5) 
那么 从 三 角 分 解 的 本 质 上 的 唯一 性 , 必 有 
了 一 DID Ri 一 D7'LID,, (52.6) 
其 中 芒 是 某 个 对 角 和 矩阵 .因此 
入 一 上 TZ 
A = RL 一 DEIDDTZLD 一 Di 和 Di。 (52.7) 


我 们 可 以 看 出 ,在 每 一 步 是 用 一 个 对 第 相似 变换 从 入 得 到 4,。 我 
们 可 以 写 
A, = DsAD,s, (52.8) 

注意 ,即便 4 不 是 正定 的 ,这 也 是 正确 的 虽然 在 这 种 情况 下 ,对 
于 偶数 :矩阵 D, 是 复 的 ,并 且 可 能 达到 某 一 状态 ，4, 不 能 作 三 
角 分 解 。 

在 正定 的 情况 下 , 我 们 知道 4, 最 终 变 成 对 角 型 ,而 4 只 是 上 
三 角 型 。 D, 的 元 素 最 终 达到 (4,)~ 扩 数量 级 . 

53. 我 们 可 以 把 原点 位 移 结合 在 Cholesky LR 算法 中 , 但 如 
果 我 们 要 保证 所 有 元 素 都 保持 为 实数 以 及 过 程 数值 稳定 ， 那 么 应 
选择 位 移 和 使 得 在 每 一 阶段 (4, 一 名 站) 都 是 正定 的 , 另 一 方面 ,为 
了 使 得 收 敏 决 , 带 望 选取 如 尽 可 能 接近 最 小 特征 值 。， 与 Hessen- 
berg 型 相 比 较 ， 这 个 无 的 选择 是 比较 困难 的 问题 。 在 9R 算法 中 
没有 这 样 的 问题 ,而 且 我 们 完全 不 必 关 心 正 定性 。 


QR 等 法 的 三 次 收效 性 
54. 原点 位 移 的 最 简单 选 法 是 无 一 a 名 我 们 要 证 明 , 通 常 戏 
于 8R 算法 ,这 种 选 法 对 于 宰 最 小 的 特征 值 最 终 给 出 三 次 收 策 性 ， 
而 不 尝 字 是 否 为 多 重 特征 售 。 候 定 
和 一 
tal > 1 > Neral, 
如 果 我 们 记 


(54.1) 
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， (54.2) 
C 


那么 从 $32 中 的 一 般 理 论 可 知 , 当 不 使 用 位 移 时 ，G， 趋 向 于 零 逢 
阵 ,PF 的 特征 值 (i 一 1，2,-…8 一 了) 趋向 于 对 应 的 2 而 也 
的 特征 值 


4 一 站 


和 人 一 二 一 7 十 1 oa) 
趋向 于 j。。 假定 过 程 已 达 某 个 阶段 ,这 时 候 


F, igkK, 
-| 志和 | Id 一 1, 6543) 
H, 
B41 > 于 1 一 1G 一 bb 


s < hl, (54.4) 


现在 我 们 知道 (4, 一 4。1) 的 秩 总 是 ”一 ”而 从 (54.4) 知 (FF, 一 
4,1) 的 秩 也 是 ”一 *。 因此, 我们 必 有 
H,— hl 一 BKICE, 一 17) 天 ,一 0。 {54.5) 
这 给 出 
Hm hl +t SKIF, hI Kl +t M, (54.6) 
矩阵 范 数 的 一 个 简单 运算 证 明了 
Naa, ls < KNCE, — 3.7) 7) 


312. Li- 一 
S/S li hl he hl 
1 
< 言 lor 一 和。 (54.7) 
这 些 结果 说 明 及 的 非 对 角 元 的 模 是 数量 级 ,而 ;的 每 一 个 对 
角 元 与 4 的 差 是 数量 级 .特别 是 
le — hl < hl < ll (54.8) 


并 得 到 
天 一 > 四 一 一 一 唱 
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> 二 一 和 G12 549) 


一 a 入] < 一 可 十 | 一 区 | 
<<3s211 — ha) 全 一 2 一 二 12) (54.10) 
现在 我 们 研究 用 位 移 a 总 作 一 步 QR 的 影响 。 因 为 ,一 号 
是 8 数量 级 ,而 及 一 a 如 Gi 一 1，2,.…-,n 一 +) 与 8 无关 ,从 一 般 
的 收敛 性 理论 (参见 $19) 得 知 ， 我 们 可 以 期 望 eK? 的 元 素 被 乘 上 
一 个 数量 级 是 8? 的 因子 , 但 这 对 给 出 明确 的 证 明 是 有 益 的 . 设 P， 
是 正 交 矩阵 , 它 使 得 P(4, 一 a81) 是 上 三 角 型 , 记 


P= | Ain— P(A, — aBDPY 
Ful Gr 
十 a1 一 |--- 一 一 一 。 (54.11) 
GH Hon, 
我 们 得 到 
0O= 5S(F,—a®l) + eT,K, (54.12) 
和 Gl 一 [eSiK, 十 了 (再 一 6 名 DRT， (54.13) 
因此 


Gulls < elsls + NT, lallsslslH, 一 «il 
(因为 Rs = sle). (54.14) 
由 (54.12) 和 (54.10) 
Isis = ellT,K(F, ~ aI) "ls 
< eT max|(% — a | 
< 25lT, le/ Is, 一 加 |. (54.15) 
杀 此 最 后 得 到 
llGnlls < 467 | 一 0 + 280T max [2 
—a@1/ li — 4,l 
< 108 NT 8/ |], 一 sb? 
< 10r8 [ho — 4)?, (54.16) 
这 就 建立 了 三 次 收敛 性 .注意 ,这 意味 着 所 有 个 重 特征 值 被 同时 
找到 ,可 见 重 特征 值 并 不 是 坏 因素 而 是 有 利 条 件 。 
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实际 计算 中 ,我 们 使 用 位 移 的 时 刻 远 比 我 们 证 明 中 说 的 早 , 通 
常 < 名 有 一 位 二 进位 稳定 就 立刻 使 用 。 


Cholesky LR 中 的 原点 位 移 


55. 现 在 转 到 Cholesky LR， 我 们 注意 到 ,如 果 
(A KI) = LLi, {55.1) 
那么 由 《50.3) 得 
det(Ai — kl) 一 det( 4 一 无 1) = (HY, (55.2) 
因此 每 次 分 解 ,对 于 值 1 一 志 可 以 计算 det(4: 一 21)， 攻 名 和 
如 -1 都 小 于 jw， 那 么 因为 
det(d — 17) — 4) = I — 1). (55.3) 


显然 ,如 果 

Rn [HCD — OR/ FR) 一 FR) (55.4) 
就 有 ws < lw， 并 且 

hh < (一 下) 和 《le 一 无- (55.5) 
一 旦 我 们 得 到 胡 和 心 都 小 于 4,, 那么 就 能 产生 一 个 序列 , 所 有 
的 值 都 小 于 1,。 但 收敛 于 4,。 若 4: 是 正定 的 ， 可 以 取 名 一 
一 2- 提 4 让， 襄 一 0， 以 后 所 有 的 名 都 是 正 的 。 注 意 , 在 运算 精 
度 意 义 上 , 当 一 4。 我 们 就 不 必 继 续 选 代 。 一 旦 第 + 行 和 第 
列 的 非 对 角 元 素 可 以 忽略 , 我 们 就 可 停止 选 代 并 降 阶 。 如 果 在 每 


一 步 都 保持 工 嵌 的 最 后 两 个 值 , 我 们 能 在 降 阶 后 计算 一 个 好 


的 初始 位 移 。 
如 果 没 有 重 的 或 病态 的 很 靠近 的 特征 信 ， 这 个 技术 是 十 分 简 
单 并 且 非 常 有 效 的 。 


Cholesky 分 解 失败 


56. Rutishauser (1960) 已 建议 一 个 最 终 得 到 三 次 收敛 的 原 
点 位 移 的 选择 方法 。 它 是 基于 对 选取 的 大 于 4, 时 发 生 的 中 断 
所 作 的 分 析 ， 为 了 研究 这 点 ,我 们 略 去 下 标 *。 若 记 
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Pf Fi 
4 一 机 一 上 LT A= |- 
GT | 


(56.1) 


那么 
MMT 一 下 一 他，MRNT 一 G， 

NNY -上 PPT — H— RL. (56.2) 
假定 分 解 过 程 已 作 到 M，WN 都 已 确定 , 但 在 设法 确定 了 的 第 一 个 
元 素 时 如 到 负数 开 方 ,由 (56.2) 我 们 得 

PPT 一 百 一 好 一 GIF — tI)G 一 和 《56.3) 
而 我 们 的 假定 是 xx 是 负 的 。 设 * 是 和 的 代数 值 最 小 的 特征 值 , 从 
我 们 上 述 对 和 的 假定 ， 显 然 这 是 负 的 。 我 们 要 断定 〈4 一 好 一 
7 站) 是 正定 的 ， 焕 名 话说 ,如 果 我 们 重新 用 位 移 (《 上 z] 代替 不 开 
始 运算 ,我 们 就 能 够 完成 约 化 变换 、 
显然 ， 因 为 7 是 负 的 ,我 们 至 少 可 以 运算 到 先前 那 一 步 ,并 且 
有 关 的 矩阵 一 更 在 满足 关系 
PPr= Hirt — 6(F -rnG 
= (KX—rI)+ GU(F— hIG 
一 GTCP 一 好 一 zD-G 一 了 。 (56.4) 
我 们 必须 证 明 ，Y 是 正定 的 。 现在 因为 "是 X 的 最 小 特征 值 ， 
(X 一 TI) 是 非 负 定 的 , 令 8 是 一 个 正 交 算 阵 ,使 得 
了 一 QTdiag(%)Q. (56.5) 
因为 我 们 假定 了 《F 一 好 ) 可 以 分 解 , 故 一 > 0G 一 1, 2， 
…"， 四 ), 因此 我 们 得 到 
GUF ~ RI)-G 一 GTCF 一 好 一 rmG 
一 GT07[diag( 和 一 和 一 dag( 一 在 一 7 "0G 
= SdiagL~—r/ Ch — OL 一 下 一 裤 ]3. (56.6) 
这 对 角 和 矩阵 的 元 素 全 是 正 的 ， 因 此 (56.6) 式 右边 的 矩阵 当然 是 非 
负 定 的 ， 而 且 除 非 3 和 G 有 线性 相关 的 行 ， 否 则 它 也 必定 是 正定 
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的 。Y 总 是 非 负 定 的 ,并 且 一 般 说 来 是 正定 的 . 

为 了 利用 这 个 结果 。 以 下 两 点 是 重要 的 。 首 先 要 保证 中 断 在 
很 后 的 阶段 才 会 发 生 ， 那 时 是 一 个 低 阶 矩阵 (最 好 是 一 阶 或 二 
阶 ), 而 且 其 特征 值 容易 计算 出 来 。 其 次 是 保证 下 十 了 很 接近 2。- 
下 一 节 我 们 讨论 这 个 问题 . 


三 次 收效 的 L 尺 方法 


57. 设 4 是 554 中 讨论 过 的 那 种 矩阵 , 我 们 现在 还 假定 它 是 
正定 的 。 假设 已 用 Cholesky LR 算法 迭代 到 4,， 它 满足 《54.3) 
和 (54.4) 的 条 件 。 从 (54.6) 我 们 知道 ,这 时 已, 的 所 有 对 和 元 与 
41s 的 差 是 @ 数量 级 的 量 。 假 定 我 们 用 a 名 一 4, 十 wm 从 作为 我 们 
的 原点 位 移 ,这 样 分 解 必 定 遭 到 失败 ,因为 对 称 矩 阵 的 任何 一 个 对 
角 元 都 超过 它 的 最 小 特征 值 、 可 是 ,由 ( 54.9) 得 知 , 在 (2 一 + 十 
1) 步 之 前 是 不 会 失败 的 。 在 这 一 步 有 关 的 矩阵 给 定 为 

X=H,— (lt mi) — eKI(P, — oanI)K, 
Mol 十 BKIF, — Ml) TK, — (hs + mii) 
— eKI(F, — aBI) Kk, 


由 (354.6) 
mL + KILCF, — 41) 
—(F,— aR K,, (57.1) 
这 是 一 个 > 阶 抵 隆 。 如 果 上 是 光 的 一 个 最 小 特征 值 。$ 56 的 论证 
表明 ,so 名 十 + 是 一 个 可 入 的 位 移 ， 现 在 。 我 们 证 明 它 非 常 接近 
1。 记 
天 一 一 mg 十 Y 
我 们 得 到 yl < ell(P, 一 10- 一 (P, 一 上 820- 业 。 《57.2) 
因为 在 右边 的 两 个 拭 阵 有 相同 的 特征 向 最 组 ,我 们 可 得 
Yh omax lI 一 和) 一 1 一 
mex| (a — 45)/ (2 一 加 (入 一 2 


< 世 2/[ 0 一 2 并 [ 3/0- 一 2 咱 . 
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由 (54.8),(54.9) 和 《54.4) 得 到 
Der/ — ha) (57.3) 


因为 + 等 于 一 ”总 与 的 最 小 特征 值 之 和 ,所 以 
4 加 十 工 一 十 om 只 一 mi 吕 七 了 的 最 小 特征 信 (57.4) 


Wj) hls C2 0. — te), (575) 


现在 我 们 能 进行 类 似 于 $ 54 的 一 个 直接 的 分 析 来 证 明 ; 如 果 我 

们 对 4: 一 《a 明 十 ?1 作 一 次 送 代 ， 那么 上 Gonllz 是 中 数量 

级 。 我 们 把 它 留 作 练习 ， 一 般 的 理论 十 明了 G, 缩减 的 倍数 是 
M2 一 (< 总 十 可 ]10 一 (< 名 十 裤 1 放 


的 数量 级 , 即 s: 数量 级 。 由 于 G; 是 8 数量 级 ,因此 这 就 建立 了 我 
们 的 结果 。 

58. 我 们 已 研究 了 最 小 特征 值 是 多 重 的 情况 ， 在 实际 中 当 7 
是 1 或 2 时 ,方法 是 最 适合 的 ,因为 这 时 最 小 的 特征 值 * 很 容易 找 
到 。 

要 确定 我 们 是 否 已 达到 了 应 用 这 个 方法 是 有 利 的 阶段 不 是 一 
件 容 易 的 事情 , 实际 上 必须 以 经 验 作 基础 来 判断 ， 下面 是 一 个 用 
于 单 重 特征 值 的 主要 策略 . 

用 和 任 一 适当 方式 ,例如 像 $55 的 方法 ,确定 正 位 移 直 到 (a 名 一 
和 1) 比 4, 其 它 的 所 有 对 角 元 小 得 多 , 并 且 最 后 的 行 \ 列 的 非 对 角 
元 是 小 的 。 然 后 我 们 取 a 名 作为 下 次 的 位 移 ， 这 分 解 就 失败 。 恕 
在 失败 点 留 下 的 矩阵 阶 数 大 于 2， 我 们 是 改变 方法 太 早 了 《注意 。 
如 果 特 征 值 重 数 确实 大 于 2; 那 么 失败 总 是 很 早出 更 ). Rutishauser 
和 Schwarz 《1963) 已 经 研究 了 一 个 应 用 这 个 方法 的 巧妙 的 策略 ， 
我 们 建议 读者 参阅 他 们 的 论文 。 

也 许 值得 提出 的 是 ,对 Cholesky LR 应 用 “ 非 复位 方法 "要 更 
简单 些 , 元素 a 中 在 每 一 步 给 我 们 关于 收 化 性 的 重要 信息 。 因为 
4 是 通过 计算 L，L,-: 形成 的 ， 它 至 少 是 非 负 定 的 。 如 果 
6 名 < s， 那 么 这 时 降 阶 对 每 个 特征 值 产 生 的 误差 都 小 于 es。 事 实 
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上 ,如 果 (e 一 1 阶 前 主子 矩阵 的 特征 值 是 5%。 则 
三 
及 二 (58.1) 
于 0、 
由 此 得 到 我 们 的 结论 。 注 意 ， 当 最 后 一 行 最 后 一 列 的 非 对 第 元 素 
充分 小 时 ,不 管 名 是否 小 都 可 以 降 阶 ，a 品 小 的 情况 仅 当 位 移 选 
得 好 的 时 候 才 会 出 现 。 


带 状 矩阵 
哆 ,对 于 一 般 对 称 和 矩阵 ， 工 作 最 是 过 高 的 ， 而 对 带 状 矩阵 
本 一 0 (li—il>m) (m+1<&n) (59.1) 
则 不 是 这 样 . 我 们 首先 考虑 Cholesky LR 算法 , 显然 它 保持 还 型 
不 变 (对 于 非 对 称 抢 阵 参见 $ 66) ,并 且 在 每 一 步 ,的 元 素 是 
=0 Gi>m), (59.2) 
因此 4, 虽然 在 一 般 的 行 中 有 2m 十 1 个 非 零 元 ,但 工 , 仅 有 mw 十 1 


个 


有 若干 执行 分 解法 和 安排 存储 的 办 法 。 如 果 希 望 充分 利用 内 
积累 加 的 优点 ,下 述 方法 是 最 方便 的 、 

用 一 个 新 方式 记 4 的 元 素 是 方便 的 。 它 可 以 充分 利用 和 矩阵 的 
带 状 和 对 称 的 全 部 优点 。 我 们 用 * 一 8, w 一 3 的 例子 来 说 明 这 
一 点 。 

4 的 上 三 角形 部 分 
Li 
dn dn Aan an 
de Cn dy A 
Ap Gn Mg gu 


Gy a I 4 


日 572。 


存储 数组 
An an A A 
oo on, EF “An 
a a, A A 
a a 4 
人 
ao tor 26 0 
an am 0 0 


an 0 0 0 


4 是 以 矩形 ” X (m 士 1 数组 存储 .在 上 面 的 存储 数组 右 下 角 被 
零 填 充 ， 如 果 分 解 象 我 们 描述 的 那样 和 进行。 这些 元 素 可 以 任意 提 
供 。 虚线 表 示 4 的 一 列 元 素 。 上 三 角形 上 一 上 L7 用 与 4 的 上 半 部 
相同 的 形式 产生 。 它 可 以 覆盖 在 4 上 ， 但 如 果 我 们 考虑 到 使 用 的 
位 移 大 于 xz。 时 ,我们 不 能 这 样 作 。 六 为 分 解 要 失败 ， 并 且 我 们 必 
须 重新 开始 。 

60， 忆 的 元 素 逐 行 产生 ,第 守 行 的 元 素 计算 如 下 : 

(i) 确定 如 一 min(n 一 i m)。 
然后 对 于 i 从 0 到 ?z 的 值 执行 (3) 和 (证 )。 

(ii) 确定 9 一 min(m 一 j,i 一 1), 

《过 )》 计算 x 一 一 之 (uak)(w-hir#)。 如果 49 一 0, 式 

= 

中 的 和 是 零 . 

着 ?一 0 则 ww 一 (x 一 《如果 = 一世 是 负 的 ,名 
是 太 大 了 )。 

若 1 关 0 则 smi 一 zf/ un 
例如 ,对 一 5， 和 一 3， 2 一 8， 我 们 有 


Hy = a Hb 一 一 


tp 一 09 一 Wake 一 26508633 (60.1) 


0 ei et 


Watsy 一 人 为。 
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引入 量 p。9 是 为 了 处 理 末 端的 影响 . 
现在 我 们 必须 计算 (ZV7A 世 六 ,计算 的 矩阵 要 覆盖 在 原来 的 
矩阵 4 上 ,如 果 了 已 经 组 盖 在 原来 的 4 上 ,这 是 不 会 发 生 任何 困难 
的 ,因为 到 计算 新 的 si 时 ,已 不 再 需要 4 的 第 ; 行 元 素 , 计 算 如 下 
(i) 确定 请 一 min(m 一 i,m), 
然后 对 i 的 值 从 0 到 ? 执行 (i) 和 ( 告 ). 
(ii) 确定 4 一 min(m 一 j, nn 一 i 一 人 站。 
《于 ?计算 x 一 之 LR A 
若 了 一 0， 则 om 一 十 克 . 
若 j 关 0, 则 or 一 x。 
作为 例子 , 当 i 一 5，m 一 3， 有 


9 一 toto 十 tsittst 十 oz 十 tag 十 天。 


一 0560 + Wyter 十 ths3ts2, (60.2) 
dg 呈 at 十 ts3tény 
四 一 apm 


在 有 两 级 存储 装置 的 计算 机 上 分 解 和 复合 可 以 结合 起 来 ， 当 计算 
0, 的 第 i 行 时 , 4, 的 第 i 行 和 UU, 的 第 i 一 1,1 一 2,… yi 一 1p 行 必 
须 在 主 存 . 一 旦 计算 了 U, 的 第 i 行 , 立 即 可 计算 4 的 i 一 吉 
行 .如 果 我 们 考虑 使 用 的 扎 值 要 引起 中 断 , 我 们 仍然 不 能 那样 做 。 
61. 假如 我 们 采用 $56 的 Rutishauser 的 技术 。 我们 必须 检验 
每 一 个 失败 。 如 果 失 败 在 i 一 ”时 发 生 , 那 么 当前 的 * 值 就 是 下 
次 的 位 移 。 如 果 类 败 发 生 在 i 一 » 一 1， 我 们 必须 计算 (56.3) 式 
的 2 Xx 2 矩阵 XX， 我 们 得 到 
zu 一 当前 的 x 值 ， 


Fa at 一 tp-iaffa-20 一 am3ada-3,3 一 (611) 


i 

一 
我 们 需要 这 个 2 x 2 矩阵 的 较 小 的 一 个 特征 值 、 如果 失 败 发 生 较 
旱 , 那 么 利用 留 下 来 的 矩阵 的 特点 是 不 方便 的 ， 
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在 分 解 和 复合 过 程 中 都 有 大 约 二 nm 个 条 法 。 如 果 mm < m， 


这 时 远 比 满 矩阵 需要 的 少 ， 在 第 四 章 $ 40 我 们 已 看 到 ， Cholesky 
分 解 的 误差 是 很 小 的 ， 例 如 ,使 用 内 积累 加 的 浮 点 运算 , 我 们 得 到 


LLI= 4 十 EE, Pl 2 (612) 
其 中 E, 是 形式 相同 的 带 型 矩阵 。 
类 似 地 ， 
hn = LL + Fa II < 2 (61.3) 


其 中 P, 仍 是 带 形 的 。 从 这 些 结果 容易 看 出 ,在 每 一 个 特征 值 中 由 
一 个 完整 的 变换 引进 的 极 大 误差 是 (2m 十 1)2 如 果 4; 被 平衡 
使 得 ij4Jl。 < 1， 那 么 所 有 14,| 的 元 素 都 以 1 为 界 。 注意， 如 结 
果 我 们 比较 计算 的 4, 和 准确 的 4,， 我 们 可 能 误 认为 特征 值 的 精 
度 是 很 低 的 (例如 ,参见 Rutishauscr 1958, p. 80)。 


带 状 矩阵 的 QR 分 解 


62. QR 算法 保持 带 状 不 变 并 不 十 分 明显 。 2R 分 解 产生 的 
矩阵 R， 其 带宽 是 2m 十 1， 而 不 是 像 Cholesky LR 分 解 那 样 是 
吉 十 1， 如 果 我 们 使 用 Houscholder 方法 作 三 角 化 (第 四 章 , 5 46) 
需要 =” 一 1 个 初等 Hermite 矩阵 PP Psmss 对 应 于 Pi 的 向 
量 wi; 仪 在 位 置 i， i 十 1,，…, i 十 wm 上 有 非 零 元 (当然 , 较 后 的 wi 
例外 ), 对 = 一 8，m 一 2 的 情况 ,和 矩 阵 PP,d, 和 R, 给 定 为 


x x x x x 

oo xx xxx 

0 0 x x x x 

0 x x x x 

Pd 一 xxxxx 小 

x x x x x 
x XxX x Xx 
x X X 


。575。 


x x x x x 


x x x x x 


x x x x x 


(62.1) 


为 


示 : 


在 前 者 ,用 0 表示 由 P, 和 P 引 进 的 零 ， 现在， 研究 用 局 右 乘 , 右 
乘 后 矩阵 的 第 1 列 到 第 ”十 1 列 由 它们 的 线性 组 合 代替 。 因此 ， 


RP 表 


RP 


XXXX x 
XXX x x 

XXX X X 

X X x xx 

X X X X 

X X X 

X X X 

又 X Xx 


RPPP, 


XXX x x 
X XXX x 
XXX X X 
X XXX X 
X XXX X x 
XXX XXX 
X X X X 
xX x Xx 
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以 后 用 P…*，P.。， 右 收 , 保 持 第 列 不 变 , 因 此 4vn 在 这 列 有 
严 十 1 个 元 素 。 继续 做 下 去 可 看 出 4 在 每 一 列 对 角 线 以 下 仅 
有 w 个 元 过 (当然 ， 最 后 m 列 除外 )。 可 是 。 我 们 知道 ,最 后 的 矩阵 
是 对 称 的 。 因 此 ,对 于 ji >i 十 m， 在 位 置 (i, 门 上 的 元 素 必 定 是 
办. . 

显然 ,为 了 计算 4 的 下 三 角 部 分 ,我 们 仅 用 在 位 置 (i, 门 上 
的 元 素 , i 一 i i 十 1，…, i 十 wm， 因此 ,在 计算 ,时 ,我 们 只 需 
在 每 行 中 产生 前 mw 十! 个 非 霉 元 

63. 为 了 利用 这 特点 和 对 称 性 的 结构 。 我 们 需要 一 些 辅助 丰 
储 空间 。 为 简单 起 见 ， 假定 我 们 开始 计算 4sr 之 前 已 计算 了 R,。 
通过 考虑 具体 的 一 步 来 描述 三 角 化 最 为 简单 ， 因 此 。 我 们 集中 讨 
论 4 一 8, mm 一 2 情况 中 4, 的 三 角 化 的 第 4 大 步 。 这 一 步 开始 时 
的 矩阵 形状 为 


A, 和 R, 
rp rn rn 
Ta ra fn 
fm Ta Ty W, 
M0 da 44 Wh Wh wu (63.1) 
Wp Wy Wn | 


Wy Wa Wy 


ye yu yo ye 0 
2 5 zs» 0 |. 
aa An 《ao 一 向 ) at ae 


矩阵 W, 由 矩阵 PP 对 应 的 向 量 wi 构成 。 对 于 一 般 情 况 , 辅 助 存储 
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器 需要 2m 十 ! 个 元 素 的 向 量 玫 + 1 个 。 在 我 们 的 情况 ,第 4 大 
步 开 始 时 , 它 就 包含 了 用 yw，*…* ,ys 和 xyz 表示 的 行 庙 量 。 
它们 是 部 分 地 作 了 处 理 的 第 4 行 和 第 5 行 。 在 (63.1) 中 显示 的 存 
储 安 排 是 在 整个 矩阵 的 右 下 角 沿 未 三 角 化 时 得 到 的 存储 安排 ， 这 
样 , 向 量 ” 和 zx 的 下 标 表明 了 相对 于 对 角 线 的 不 同位 置 。 第 4 步 
是 : 


(i) 传送 4, 的 整个 第 6 行 到 辅助 存储 并 结合 所 示 的 位 移 ( 注 
意 ，4, 的 全 部 有 关 行 仍然 可 以 得 到 ). 

人 ki) 从 元 素 yw zm， aa 计算 向 量 歼 ,/。( 对 于 一 般 情况 , w, 有 
雪 十 1 个 非 圳 元 ,) 存 储 w, 作为 w: 的 第 4 行 。 

(省 ) 用 P, 左 乘 。 这 个 变换 影响 的 元 素 只 是 在 辅助 存储 中 那 
些 元 素 ， 这 个 左 乘 (而 不 是 存储 ) 的 结果 在 (63.2) 中 指出 ， 仅仅 R 
的 第 4 行 前 3 个 元 素 需 要 计算 . 


yo 加 ya yo 0 
PX | so ss 9 zs 0 
ao ds (qo—%) a qe 


0 知 ya 知 各 |. 
0 gw ait ae Zss 
产生 的 R, 的 第 4 行 要 盖 在 4 的 第 4 行 上 (注意 ,仅仅 前 3 个 元 素 
被 产生 ) ,而 产生 的 元 素 yw，su 覆盖 在 辅助 存储 中 > 和 * 的 位 置 
上 . 因此 , 在 〈 赴 ) 完成 后 算法 的 阶段 置 为 第 5 大 步 ， 当 然 通常 
存在 结束 的 效果 .因为 对 2R 算法 ,我 们 并 不 打算 因 分 解 失 败 再 
重新 开始 ,我 们 总 可 以 把 R, 材 羡 在 4, 上 ， 
64. 现在 我 们 转 到 复合 的 问题 ,4,4 逐 行 产生 并 覆盖 在 R, 上 , 
实际 上 , 我 们 只 产生 4 的 每 列 对 角 线 以 下 的 元 素 ， 并 转 为 44+， 
对 应 的 行 的 对 角 线 以 上 的 元 素 。 这 样 就 利用 了 4sr 的 对 称 性 , 并 
且 节 省 了 计算 量 ， 
我 们 叙述 计算 4 的 第 4 行 的 步骤 。 对 于 一 般 情 形 辅助 存 

储 是 一 个 (m 十 1) X (m 十 1) 数组 ， 在 我 们 现在 的 情况 ,在 第 4 
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(63.2) 


大 步 开始 时 用 知 和 3%, 各.《 符 号 ~ 表示 这 些 量 与 《63.1) 的 无 关 ) 
表示 的 列 向 量 已 在 辅助 存储 中 ,用 数组 表示 如 下 ; 


9 一 一 


加 sm ra 


Fa Eu ra| X “一 | 和 Zo 《64.1) 


0 0 ra 
第 4 大 步 如 下 : 

(i) 传送 R, 第 六 列 的 元 素 ro，ra， ru 到 辅助 存储 , 如 (64.1) 
所 示 
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(ii) 用 “P 右 乘 在 辅助 存储 中 的 3 X 3 矩阵 。“P?" 是 P 的 
子 和 矩阵 , 它 是 w, 的 通 数 。 所 得 的 矩阵 的 第 一 列 给 出 44: 的 第 4 
行 的 相应 的 元 素 。 另外 两 列 为 下 一 大 步 提 供 向 量 了 和 3.。 注意 ， 
只 执行 用 P, 右 乘 涉及 的 一 部 分 计算 。 

现在 分 解 和 复合 显然 能 结合 起 来 .在 我 们 的 例子 中 ,一 旦 KR 的 
前 三 行 计算 后 就 有 充分 的 信息 确定 4,;， 的 第 一 行 。 在 一 般 情况 
下 ,在 分 解 之 后 可 以 复合 名 行 ， 并 且 这 样 做 后 我 们 不 必 存 储 整 个 
w,， 而 仅 需 要 存储 最 后 的 “个 向 量 wi。 由 于 我 们 仅 对 小 带宽 矩 
阵 推荐 使 用 OR (和 LR) 算法 ,需要 的 辅助 存储 量 与 4， 相 比 是 
微小 的 ， 有 意义 的 是 ,如 果 分 解 和 复合 结合 起 来 ,那么 OR 需要 的 
存储 量 小 于 有 失败 的 分 解 的 Choiesky 算法 . 


误差 分 析 


65. 利用 对 称 性 时 ,我 们 假定 了 那些 用 准确 计算 应 是 零 的 元 索 
am 之 f 一 1 所 2m) 可 以 忽略 。 验证 这 个 假定 的 合理 性 是 重要 
的 ,幸而 这 已 被 第 三 章 $45 的 普遍 性 分 析 包 括 了 。 如果 六 是 计算 
的 矩阵 (对 角 线 以 下 是 准确 的 零 )， 又 P，P,,…，P。-: 是 准确 的 
Hermite 矩阵 ,它们 对 应 于 逐次 计算 的 约 化 矩阵 ,那么 我 们 有 

RK, = (PP Pi 4 十 五， (65.1) 

其 中 E, 是 元 素 为 小 量 的 矩阵 ， 宴 实 上 ,我 们 仅仅 计算 天 的 一 部 
分 ,但 我 们 使 用 了 与 计算 整个 灵 , 该 用 的 完全 相同 的 算术 运算 . 

现在 我 们 用 计算 的 初等 Hermite 矩阵 BP 逐个 苹 计 算 的 ， 
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不 计 任 何 可 能 产生 的 含 人 误差。 所 得 的 矩阵 和 +: 的 每 一 列 肯 定 其 
对 角 线 之 下 仅 有 普 个 元 素 。 假如 作 了 全 部 计算 的 话 , 我 们 的 一 般 
分 析 证 明 ， 计算 的 44,， 应 满足 关系 
Anm™— Rb Pt F, 
Ps * "PAP Psi + EPi* Ps + PFs, {65.2) 
其 中 F, 是 元 素 为 小 量 的 矩阵 ， 事 实 上 ,我们 仅 按 这 种 方式 计算 了 
Zr 的 下 兴 部 ， 然 后 根据 对 称 性 结 出 了 我 们 的 整个 矩阵 444;。 显 
然 ,我 们 得 到 
{Gslls = Ans — Pie" PiAP1: Po ila 
280EP: :Poslls 十 上 Ps (65.3) 
28HE,s + Flel,. 
对 于 有 累加 的 泽 点 计算 可 以 证 明 ,对 某 个 常数 K, 有 
NGsille < Km2™" Aulle, (65.4) 
因此 我 们 可 以 希望 得 到 很 高 的 精度 。 在 一 步 OR 中 前 工作 量 大 约 
为 一 步 Cholesky 的 三 倍 ; 虽 然 我 们 业已 夏 到 〈$51)， 不 用 位 移 时 
一 步 9R 等 价 于 两 步 Cholesky 工 R， 用 QR, 原点 位 移 选 择 十 分 简 
单 ， 如 果 取 无 一 a 铝 ， 收 化 性 最 后 是 三 次 的 。 选取 记 是 右 下 角 
2 x 2 阵 的 小 的 那个 特征 值 能 够 得 到 更 好 的 收 策 性 通常 ,实际 
上 仅 需 要 极 少 次 迭代 。 如 果 拭 阵 是 正定 并 且 用 零 作 位 移 作 一 两 步 
预先 的 迭代 ,通常 可 以 按 递 增 的 顺序 找到 特征 值 ,但 一 般 情况 下 是 
不 能 保证 这 种 顺序 的 . 
如 果 使 用 Rutishauser 的 分 解 失败 的 处 理 办 法 ， 对 Cholesky 
LR 原点 位 移 的 选取 是 比较 复杂 的 。 尽 管 如 此 ， 这 种 方法 还 是 很 
有 效 的 .特征 值 总 是 按 递增 顺序 出 现 ， 而 这 一 点 是 重要 的 。 因 为 
带 状 矩 阵 经 常 产 生 于 用 有 限 差 分 逼近 微分 方程 。 并 且 仅仅 是 较 小 
的 特征 值 有 意义 。 总 之 ，Rutishauser 的 技术 似乎 是 更 可 取 ,但 对 
这 两 种 技术 还 要 作 进一步 的 讨论 。 


非 对 称 带 状 和 矩阵 
66. 如 果 用 不 带 交换 的 传统 的 LR 算法 , 带 状 能 被 保持 。 事 
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实 上 ,还 不 必要 求 对 角 两 边 有 一 样 多 的 元 素 ， 但 是 ,数值 稳定 性 不 
再 能 保证 ， 以 我 们 的 见解 ,通常 我 们 不 能 建议 这 样 使 用 LR 算法 ， 
假定 将 交换 的 LR 算法 或 者 9R 算法 被 使 用 ， 那 么 通常 对 角 以 上 
的 带 状 逐 新 被 破坏 。 

4 是 三 对 角 甜 隆 的 情形 是 特别 令 人 感 兴趣 的 。 我 们 对 比 下 面 
产生 的 两 个 三 对 角 短 阵 谨 列 4, 和 各 ,第 一 个 序列 中 我 们 从 4 开 
始 并 使 用 ZR (不 作 交 换 )， 其 中 每 个 ,者 是 单位 下 三 角 型 ,第 二 
个 序列 中 我 们 从 D4:D- 天 给 ,其 中 是 某 个 对 角 和 矩阵 ,并 使 用 唱 
的 类 型 的 LR 分 解 (也 不 作 交 换 )。 $52 的 论证 表明 了 在 对 应 的 阶 
眉 有 


A = DADT', (66.1) 
其 中 D: 是 某 个 对 角 和 矩阵 ， 现 在 如 果 我 们 记 


6 
oan 柳 


1 4 (0s) 
A ， 
和 79 a0 
a bn 
所 1 人 
入 一 | 党 号 (66.2) 
a0 
那么 从 (66.1) 我 们 得 到 
oP op, PPrP dep, (663) 


因此 ,无 论 我 们 使 用 什么 三 角 分 解 , 对 角 元 相同 , 对 角 线 两 侧 的 一 
对 非 对 角 元 的 筑 积 也 相同 ,并 且 对 于 4 的 特征 值 问题 占 主导 地 位 
的 也 是 这 些 量 。 闪 此 ,如 旦 我 们 选用 DD, 使 得 


1 


D4D-: 一 12 四 工 |， (66.4) 


“Bo a 
然后 用 LR 分 解 ,在 每 一 步 L, 是 单位 下 三 角 型 ， 那 么 就 不 存在 实 
质 上 失去 一 般 性 的 问题 ， 若 记 
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人 os? 1 
Br a 1 

pe 0 

1 1 

和 1 到 9 1 

一 1 a 1 ， (66.5) 
1 四 
那么 我 们 得 到 


一 
G 一 2 7), 
弛 二 的 一 四 玉 G12 


Br = Pui = 2，… #), 


(66.6) 


因此 


wo ut, 

Iw = pF? oo frp, (66.7) 

这 些 等 式 表明 ;计算 PP,i? 之 后 ,所 有 后 面 的 wpP, 1? 不 用 计算 
和 p99 就 可 以 确定 ， 事实 上 ,如 果 定义 A? 是 零 (对 任何 :)， 那 


么 我 有 如 下 格式 
0 
wn 
0 Bd 
un a 
0 Ed Li 
DN 蚊 DD) Dd a 
坟 i “ (66.8) 
wy HD " 
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其 中 每 条 上 标 为 * 的 斜 线 可 以 它 上 面 的 任 线 用 等 式 〈66.1) 导出 . 
有 关 的 元 素 是 位 于 我 们 已 标明 的 蓉 形 的 顶点 。 熟悉 2D 算法 的 读 
害 ,会 认 出 各 和 9 数组 就 像 Rurishauser 的 9 岂 和 叶 数 组 ，9P 
算 靶 对 于 计算 学 纯 函 数 的 零点 的 一 般 问题 是 更 有 意义 的 ， 这 一 问 
题 的 完整 的 讨论 已 超越 本 书 的 范围 . 

从 我 们 虽 前 的 问题 来 看 , 8D 算法 有 一 点 不 满意 ,因为 它 对 应 
于 不 带 交 换 的 消去 法 ， 然 而 , 当 4 是 正定 了 时， 我 们 知道 如 果 全 程 
使 用 Cholesky 分 解 ,那么 数值 稳定 性 是 得 到 保证 的 。 如 果 我 们 记 

a 罗 


入 一 CG 


， (66.9) 
om a 
那么 这 种 情况 下 我 们 的 分 析 表 明 a? 和 (sf? 与 由 (66.3) 得 到 的 
op 和 好 是 完全 相同 的 。 似乎 利用 of 和 84? 更 适合 于 计算 .这 
意味 着 不 用 计算 开平 方 并 获得 Cholesky LR 的 所 有 好 处 。 从 
oP, B19 直接 得 到 of 和 By19 大 概 是 最 简单 的 想法 ,如 果 每 步 结 
合 位 移 并 用 非 复 不 的 方法 ,这 些 等 式 变 为 
wi 二 op 一 名 
= 
uP op bP, BF oo Iw 
a = gts 
只 机 在 所 有 阶 眉 ,总 位 移 小 于 最 小 特征 值 ， 所 有 of? 和 8 将 是 正 
的 ,并 且 方 法 是 稳定 的 ， 在 每 一 步 只 包含 # 一 1 个 除法 ,4 一 1 个 
乘法 . 


在 QR 算法 中 同时 分 解 和 复合 

67。 Ortega 和 Ksiser《1963) 已 经 指出 ， 一 个 类 似 的 方法 可 
以 用 8R 技术 从 4, 得 到 4ora， 并 且 不 必 开 平方 。 这 变换 要 求 对 
称 性 但 不 要 求 正定 些 。 

为 避免 上 标 5, 我 们 考虑 从 4 通过 下 述 关系 来 得 到 4 


5830 


jc = 2,:.,n). (66.10) 


4 一 QR, RQ — A, (67.1) 
这 里 赂 去 了 位 移 。 由 = 一 1 个 在 平面 (zz 十 和 D)(i 一 15# 一 
1) 的 旋转 左 乘 实现 把 4 化 为 R。 如 果 我 们 记 


qa a 页 
所 a 久 而 而 态 
4 一 Bb a | 本 一 Bi 
Ban 
7 
T 多 
R= r3 有 与 | (67.2) 
fn 


用 ci 和 表示 第 i 次 旋转 的 余弦 和 正弦 ,那么 
bir (Pt ha), ci Pi/ (p+ Hn) 
(=1, -…, 4— 1), (67.3) 
其 中 
Pi= a P= ci01 — sbys 
Pi ins; — Siciabi (f ~ 3, +, 1), 
和 ri pi sbin (Fl, sn Oo 1), re = pa, 
bt i 9 Ci Bin + siainrs (67.5) 
{i=2, ,7 1), 
下 一 30 一 1 一 2). 
另 一 方面 ,由 复合 我 们 得 
B= ert gs He ci-aciri + #9 
(=2, 0 1), (67.6) 
本 一 cores Bo grin(j = 1 一) 
如 果 引 进 量 7;, 其 定义 为 
加 一 {67.7) 
那么 出 (67.6) 和 《67.5) 我 们 得 到 
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(67.4) 


= 1+ ritien, 一 (i101), 
GO (67.8) 
Bm ps, 
这 时 对 7; 和 六 我 们 有 
Ti Ti (a+ fi), 
G2, .0), (67.9) 
六 一 ql, 一 ?Yci 若 cs 关 0 
站 一 后 用 着 cr 一 0 
最 后 算法 表示 为 下 述 式 子 
w= 0 = 1 bn 0, ds ™— 0, (67.10) 
Ti ty 
户 一 Yijcs (车 cr 也 0 
一 -2 (着 < 一 0 
Bp+tH) G1), (一 1 .a), (67.11) 
9 Bf (p+ i), 
= p/P Bi), 
wi ATi + 4st1), 
B= T+ 
注意 ,我 们 计算 和 cj; 因为 车 c; 是 小 量 ,我 们 不 能 用 (1 一 中 去 
计算 =}， 每 次 迭代 要 3n 个 除法 和 2x 个 乘法 , 但 不 用 开平 方 ， 本 
和 多 是 覆盖 在 w 和 总 上. 
对 于 一 般 对 称 带 状 撼 阵 。Cholesky LR 和 8R 都 各 有 优点 ,我 
们 难以 作出 选择 。 


缩小 带宽 

68. 如 果 只 需要 计算 一 般 带 状 对 称 矩 阵 的 少量 特征 值 ，$S$ 59 
一 64 的 技术 是 很 有 效 的 。 要 计算 较 多 的 特征 值 ,也 许 先 用 变换 把 
矩阵 化 为 三 对 角 型 是 值得 的 。 这 可 以 用 Givens 方法 或 Honsehol- 
der 方法 ,但 在 中 间 阶 段 ,带宽 增加 。 

Rutishauer 《1963) 描述 了 两 个 分 解 用 平面 旋转 和 初等 Her- 
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mite 矩阵 的 有 意义 的 约 化 方法 ,在 所 有 阶段 都 使 带 对 称 形状 保持 。 
我 们 仅 给 出 用 平面 旋转 的 方法 ， 并 且 在 我 们 的 讨论 中 只 考虑 上 三 
角 的 元 素 。 

假定 带宽 是 (2m 二 1， 第 一 步 进行 的 是 消去 〈1, mw 十 1 元 
素 , 同时 第 2 行 到 第 # 行 仍 保持 带宽 (2m 十 1)。 总 计 要 作 了 一 
[Cs 一 1)/m] 次 旋转 ， 这 时 [x] 表示 zx 的 整数 部 分 。 因 为 在 消去 
(1, wm 十 1) 元 素 时 ,旋转 在 较 下 的 矩阵 带 外 引进 非 零 元 。 新 引进 
的 非 零 元 又 村 消去 ,计算 过 程 表示 如 下 : 


消去 的 元 素 旋转 平面 ”额外 产生 的 元 素 
1，m 十 工 my 吉 十 1 珊 ，2 吉 十 1 
mm, 2m 十 1 2m, 2m + 1 2m, 3m+1 
2m，3m 十 工 3m, 3m 十 1 3m, 4m 十 1 
(p—l)m, pmtl pm, pmt1 无 


现在 矩阵 第 一 行 和 列 的 带宽 是 (2m 一 1)， 其 余部 分 带宽 是 
(2m 二 1)。 下 一 步 是 消去 元 素 《2，m 十 2), 以 同样 的 办 法 进行 。 
需要 [(s 一 2)/m] 次 旋转 。 继续 这 样 作 下 去 ,整个 矩阵 带宽 逐渐 
变 为 (2m 一 1)。 完 全 类 似 的 过 程 可 使 带宽 变 为 (2m 一 3), 最 后 变 
为 三 对 角 型 。 从 带宽 (2m 十 1) 到 (2m 一 1) 的 旋转 次 数 是 [(" 一 
D/m] Tt [Ia 一 2)/m] 二 [(a 一 3)/m] 十 …-， 近 似 于 rm/2m， 
乘法 次 数 约 为 4(m 十 1D)mz/m。 当 杰 一 2 或 3 时 。 这 方法 最 为 适 
用 . 

中 注 

Von Neuman 和 Causey (1958), Greenstadt (1955) 和 Lotkin 
《1956) 提 出 了 一 类 类 似 于 Jacobi 的 方法 , 并 建议 用 来 把 一 般 矩 阵 
约 化 为 三 角 型 。 在 1961 年 Gatlinburg 矩阵 会 议 上 ，Greenstadt 概 
述 了 直至 当时 的 进展 ,并 指出 业已 发 展 的 这 类 方法 不 能 令 人 满意 . 

Eberlein (1962) 根据 对 于 任何 矩阵 4 总 存在 一 个 相似 变换 
8 一 P74P 任意 接近 正规 矩阵 ,提出 了 这 个 方法 的 修正 ， 在 Eber- 
lein 的 算法 中 卫 是 一 系列 矩阵 的 乘积 ， 这 些 和 矩阵 是 广义 平面 旋转 
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重 不 再 是 本 和 矩阵， 迭代 直到 刀 达 到 在 运算 精度 的 意义 上 是 正 需 抵 
阵 为 止 ， 这 方法 的 特点 是 其 极限 矩阵 一 般 是 1 Xx 1，2 x 2 些 阵 
的 直接 和 ,从 而 得 到 特征 值 。 

Eberlein 和 Rutishauser 独立 发 展 了 使 用 平面 旋转 和 对 和 角 想 羽 
变换 结合 起 来 约 化 一 般 和 矩阵 为 正规 型 。 在 每 步 的 指导 息 想 是 正 编 
Henrical 偏离 正规 性 的 部 分 (第 三 章 $ 50)， 在 这 方面 的 发 展 可 能 
产生 新 的 方法 超过 我 们 已 经 叙述 过 的 。 并 且 这 似乎 是 最 有 和 希望 的 
研究 方向 我 给 出 的 误差 分 析 没 有 涉及 这 一 类 方法 .但 是 ， 可 以 
期 望 它们 是 稳定 的 ,因为 逐次 约 化 的 矩阵 趋向 于 一 个 正规 算 阵 ,而 
后 者 有 非常 良 态 的 特征 值 问题 。 

1955 年 Rutishauser 首先 给 出 LR 算法 的 报告 ,此 后 他 稳步 地 
发 展 和 推广 了 这 一 理论 , 发 表 了 一 系列 文章 。 这 里 我 力图 用 Ruti- 
shauser 的 文章 的 最 新 内 容 和 我 自己 在 转 立 实验 室 的 经 验 给 出 一 个 
说 明 。 我 已 包括 了 Rutishauser 在 他 的 原著 中 给 出 的 收敛 性 证 明 。 
这 些 证 明 是 典型 的 并 且 别 的 人 也 采用 了 .。 1959 年 作者 首先 使 用 
了 适用 于 Heassenberg 矩阵 的 有 原点 位 移 和 带 交 换 的 LR 算法 . 
主要 是 用 在 复 矩 阵 上 ， 

关于 9R 算法 Francis 的 研究 工作 可 追 滴 到 1959 年 , 但 直到 
1961 年 才 发 表 ， 与 此 同时 ，Kublanovskaya 《1961) 独立 地 发 表 了 
这 个 算法 。 按照 在 这 本 书 中 我 们 的 有 关 正 交 、 非 正 交 变换 的 平行 
处 理 , 这 方法 是 LR 算法 的 一 个 宫 然 的 推广 ， 但 Francis 的 文章 中 
包括 了 比 单纯 的 DR 算法 更 多 的 内 容 。 结合 原点 复 共 箔 位移 和 
$38 叙述 的 处 理 相 邻 的 小 下 次 对 角 元 的 两 个 技巧 是 OR 算法 不 可 
缺少 的 重要 组 成 部 分 ， 

在 $29~ $32 中 ,9R 算法 的 收敛 性 证 明 是 作者 在 号 这 一 章 时 
发 现 的 。 依赖 更 复杂 的 行列 式 理论 的 证 明 已 由 Kublanovaskaya 
(1961) 和 Householder (1964) 给 出 。 

1963 年 Rutishauser 在 一 篇 论文 中 描述 了 用 平面 旋转 和 初等 
Hermite 虐 阵 缩小 对 称 抵 阵 的 带宽 ,文中 还 有 以 初等 正 交 此 阵 为 基 
础 的 另 一 些 有 趣 的 变换 . 
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第 九 章 选 代 法 
引言 


上 在 这 最 后 的 一 章 中 , 我 们 研究 通常 称 为 迭代 法 的 特征 值 问 
题 的 解法 . 专 称 这些 方 法 为 选 代 法 是 不 大 恰当 的 ,因为 所 有 求 特征 
值 的 方法 实质 上 都 是 迭代 的 ， 本 章 的 方法 的 畦 点 是 , 寻求 特征 什 
时 首先 决定 一 个 特征 向 量 , 或 者 在 可 能 的 情况 下 决定 几 个 特征 向 
量 . 读 者 可 能 已 注意 到 ,直到 现在 为 止 ,我 们 还 没有 谈 过 非 Hermite 
和 矩阵 的 特征 向 量 的 计算 .原因 是 绝 大 多 数 计算 特征 向 量 的 稳定 的 
方法 的 是 “迭代 ”类 型 的 .值得 注意 的 是 ， 稳 定 的 特征 值 计算 方 
法 未 必 导 至 稳定 的 特征 向 量 计 算 方 法 。 在 三 对 角 和 矩阵 〈 第 五 章 
$48 ~ $52) 的 特征 向 量 计算 中 ,我 们 已 注意 到 这 个 问题 . 

本 章 叙 述 的 方法 都 不 如 以 前 各 章 的 方法 那样 明确 ， 虽 然 它们 
在 概念 上 都 十 分 简单 ,但 是 不 容易 使 它们 适合 于 自动 程序 的 设计 。 
识别 非 线性 初等 因子 和 决定 对 应 的 不 变 子 空间 的 技术 尤其 是 这 
样 。 实 际 上 , 如果 预先 知道 出 现 非 线性 因子 ,那么 处 理 它 是 很 容易 
的 


上 述 的 一 般 性 评论 有 一 个 例外 ,就 是 $47 ~ $60 描述 的 逆 选 
代 , 这 是 一 个 计算 特征 向 量 的 最 有 用 的 方法 。 


宪法 


2. 除了 特别 说 明之 外 , 我 们 仅 限于 讨论 食 线 性 初等 因子 的 矩 
阵 。 对 于 这 样 的 矩阵 4, 我 们 有 


A Xdiag(h KX = Xdiag(t)YT = > hry (21) 
5 


其 中 多 的 列 wy 和 7 的 行 并 分 别 是 4 的 规格 化 的 右 和 左 特征 向 
量 , 即 
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yz 一 1。 (2.2) 
因此 


A' = Xdisg(IYT = > Mri. (2.3) 
i 


如 果 
| > snl |, (2.4) 


在 (2.3) 的 右边 ,表达 式 最 终 由 bp 2ixiy7 支配 。 这 是 一 个 重要 结 


果 , 是 本 章 的 方法 的 基础 。( 我 们 已 经 看 到 ， 它 也 是 第 八 章 的 LR 
和 8R 算法 的 基础 .) 

我 们 称 特征 值 a， ,4 为 主导 特征 值 , 对 应 的 特征 向 量 称 为 
主导 特征 向 量 ,最 常见 的 是 * 一 1, 这 时 4 最 终 由 ateot 支配 

大 多 数 实用 的 技术 都 是 以 这 种 所 谓 紧 法 为 基础 ， 并 且 结合 基 
种 加 强 最 大 模特 征 值 优 势 方法 。 它们 利用 了 这 样 的 事实 : ”如 果 
P(A4) 和 4(4) 是 4 的 多 项 式 ,并 且 4(4) 是 非 奇 异 的 ,那么 

P(ANMa( A = Xding{p(1) /9(2)}Y™, (2.5) 

如 果 我 们 记 


而 一 PND1400)， {2.6) 
那么 我 们 的 目的 是 尽 可 能 选 多 项 式 FL4) 和 4(4)， 使 得 某 一 个 
1ee1 比 其 他 的 大 很 多 - 


单个 向 量 的 直接 选 代 


3. 得法 的 最 简单 的 应 用 如 下 : 设 m 是 一 个 任 悉 的 向 量 ,又 设 
序列 wv 和 由 下 式 定义 
Vir ™ Aws, tn = wit/ mar(vsn), {3.1) 
今后 我 们 总 是 以 max(x) 表示 向 量 * 的 和 模 最 大 的 元 素 。 显然, 我 
们 有 


如 果 我 们 写 


t= ditojmax( dx)。 (3.2) 


w= as (3.3) 
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那么 不 计 规格 化 因子 ，u 给 定 为 
Doin ni [+ > a 3.4) 


如 果 和 1 > [| 实 | 为 | 关 … js， 那么 假定 上 去 0, 我 们 
有 
Ws > fmaxtx) 和 max(v,) 一 和 (3.5) 
因此 , 这 个 过 程 同时 提供 了 主导 特征 信 及 其 对 应 的 特征 向 量 。 如 
果 la/24 很 接近 1, 收敛 是 十 分 刘 的 。 

如 果 有 几 个 对 应 于 主导 特征 值 的 独立 的 特征 向 量 ， 收 敛 性 不 
受 影响 ,如 果 

> 3.6) 
我 们 有 


一 天 思 mt au 
~ 立 7 (3.7) 


因此 ,迭代 趋 沿 于 特征 向 量 za， …，z*r 张 成 的 子 空间 内 的 茶 个 向 
县 ,其 极限 与 初始 向 量 % 有关。 


原点 移动 


4 最 简单 的 4 的 多 项 式 是 (4 一 P1)， 其 特征 信和 是 4 一 p。 
适当 地 选择 Pp， 过 程 便 加 速 收敛 于 某 一 个 特征 向 量 。 我 们 首先 考 
虚 4 的 全 部 特征 值 都 必 实 的 情况 .显然 ,如 果 和 >> 之 “… 之 
14s > 41, 那么 不 管 我 们 怎样 选择 p, 主导 特征 值 或 者 是 41 一 Pp， 


或 者 是 1 一 9。 要 收敛 于 =a，2 的 最 优 什 是 二 (4 十 26), 收 线 
速度 取决 于 


{23 一 2 一 2 一 1 
趋向 于 零 的 速度 。 类 似 地 , 使 过 程 收敛 于 x。，P 的 最 优 值 是 
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ti), 


收敛 性 由 量 {( 一 46-0)/(h 十 as- 一 24) 支配 ， 我们 首先 
分 析 使 用 指定 的 值 的 效果 ,后 面 再 讨论 如 何 决定 这 样 的 ? 值 . 

对 于 特征 信 的 某 些 分 布 情况 ,这 个 简单 的 策略 会 十 分 有 效 . 例 
如 ,一 个 六 阶 和 矩阵 ,5 一 21 一 六 不 用 原点 移动 , 迁 代 收敛 于 x 的 
速度 为 《19120》 .如 果 我 们 取 ? 一 17, 那 么 特征 值 变 为 3, 十 2, 士 1， 
0, 选 代 仍然 收敛 于 ma， 但 是 速度 是 由 (2/3)' 支配。 为 了 得 到 指定 
精 麻 的 a ,没有 加 速 的 迭代 次 数 大 约 是 训 速 选 代 的 八 倍 。 类 似 地 ， 
如 果 取 所 一 18, 特征 值 变 为 土 2, 土 1, 0, 一 3, 收 伊 于 xz 的 速度 由 
《2737 支配 . 

遗憾 的 是 ,对 于 常见 的 分 布 情况 ,这 个 策略 可 能 达到 的 最 高 收 
敛 率 不 是 令 人 十 分 满意 的 。 例 如 ,假定 

一 1 一 0) {4.1) 


我 们 希望 各 9 去 得 到 xs, 的 最 优 信和 是 二 (1 + 1/19), 收敛 率 由 


《180/181)* 支配 ,压缩 高 量 的 相对 误差 的 。7! 信 大 概 需要 181 次 
兴 代 。 通常 遇 到 的 分 布 情 况 是 [4 一 461 < 一 |, 对 这 样 
的 分 布 尽管 选取 最 优 的 ? 信 , 过 程 收敛 于 x。 仍然 是 慢 的 . 


舍 人 误差 的 影响 


5. 在 考虑 更 复杂 的 加 速 技术 之 前 , 估计 含 人 误差 的 影响 是 重 
要 的 。 人 们 可 能 会 认为 ,因为 直接 用 4 运算 , 见 使 4 有 病态 特征 向 
量 问 题 ,也 总 能 达到 高 的 精度 ， 但 是 事实 并 非 如 此 ， 如果 我 们 在 
$3 的 方法 中 包括 舍 人 误差 的 影响 ,那么 由 4 表示 max(zrta)， 我 
们 得 


Epi = Aw, + fs (G51) 
其 中 下 通常 是 一 个 “小 的 ” 非 零 疝 量 。 当 wri 偏离 准确 的 特征 向 量 
较 远 时 , 它 很 可 能 等 于 wm。 
例如 , 考 卉 矩阵 
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0.9901 10-(0.2000) 
4 一 >» {5.2) 
1073(—0.1000) 0.9904 


其 特征 值 和 特征 向 量 为 
思 一 0.9903， 好 一 〈1,1)， 
1 = 0.9902, x = (1, 0.5). 
如 果 我 们 取 好 = (1，0.9)， 准 确 的 计算 给 出 
yh (0.99028, 0.89126), wT 一 《1.0，0.900008-…)， 
Hi 一 0.99028. (5.4) 
4 和 思 的 分 昌之 差 小 于 5 x 10-， 因 此 如 果 我 们 用 4 位 十 进位 
浮 点 运算 ,计算 的 w+ 好 象 是 准确 地 等 于 x,。 这 样 ,过 程 保持 不 
变 。 可 以 证 明 , 差 别 大 的 向 量 w 都 显示 出 这 个 性 质 . 
和 如 果 的 模 最 大 的 分 量 是 第 i 个， 那么 我 们 可 以 把 (5.1) 
写 为 


(5.3) 


Rritn — (A + fe (6.1) 
因此 ,我 们 有 效 地 用 4 二 fcf 而 不 是 用 4 进行 了 准确 的 迭代 ， 就 
这 一 步 来 说 ， 我 们 的 过 程 趋向 于 4 十 je? 的 特征 向 量 (当然 ，4 
有 许多 其 它 的 摄 动 了 ,使 得 (4 十 F)w 一 和). 实际 上 ,计算 
Aus 的 方法 对 于 每 一 个 特征 向 量 都 存在 一 个 不 确定 的 区 域 。 一 般 
来 说 ， 有 规律 地 向 某 个 真 的 特征 向 基 逼 近 的 迭代 过 程 一 旦 达到 不 
确定 区 域 时 就 停止 改进 。 
例如 ,如 果 用 标准 浮 点 运算 计算 4w, 由 第 三 章 $ 6(*), 我 们 
得 fi(Au) = (4 + Fs)us, 
FE: < 275141diagln + 1— 2). (6.2) 
我 们 不 能 保证 过 程 在 达到 (4 + G) 的 一 个 准确 特征 向 量 w 之 后 
继续 进行 ,其 中 
1C1 < 275141diag(n + 1 CO— 人), (6.3) 
虽然 通常 达到 极限 精度 的 wx 的 误差 比 满足 (6.2) 的 摄 动 产生 的 极 
大 误差 小 得 多 .注意 ,在 (6.2) 中 每 一 个 1fsj 的 界 由 27%Cn 十 1 一 站) 
Isa 给 定 ,又 因为 它 是 直接 与 laz| 成 比例 的 ,因此 则 第 七 章 $15 
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那样 ， 用 DP"*4D (其 中 忆 是 任何 对 角 和 矩阵 ) 作 渤 代 在 主导 特征 值 
上 可 能 达到 的 精度 ,与 用 4 执行 选 代 仍 是 相同 的 . 

在 $5 的 例子 中 达到 极限 精度 的 包 + 是 一 个 为 的 很 好 的 近似 
值 ,尽管 由 它 决定 的 商量 是 很 不 精确 的 . 这 是 因为 该 矩阵 的 将 征 值 
是 良 态 的 ,但 是 特征 向 基 是 痢 态 的 ,原因 是 特征 值 是 掌 近 的 。 当 九 
是 病态 特征 值 时 , 即 二 小 时 (第 二 章 531), 特征 值 可 能 达到 的 极限 


精度 也 就 低 ， 
例如 考虑 矩阵 
1 1 0 
= 十 10” 3 | 《6.4) 
0 1 1 


它 有 特征 值 2 土 10 一 和 1 如果 我 们 取 w 一 (1,1,1), 那么 
Aw) = (2, 2 十 10 3，2). (6.5) 

结果 用 8 位 屁 数 的 浮 点 运算 ,过 程 一 成 不 变 , 并 给 出 1 一 2 作为 特 
征 值 . 

了 我们 看 出 , 在 迭代 中 产生 的 伟人 误差 的 影响 与 逐次 相似 变 
换 产 生 的 误差 在 本 质 上 没有 区 别 。 根据 我 们 的 经 验 ,情况 的 确 是 
这 个 样子 。 例 如 ,我 们 用 标准 浮 点 运算 ,对 于 主导 特征 向 量 先 代 引 
人 的 误差 , 通常 大 于 用 初等 Hermite 矩阵 以 浮 点 累加 的 方式 约 化 
矩阵 为 Hessenberg 型 产生 的 误差 。 

对 于 (5.2) 的 矩阵 ， 我们 用 适当 的 原点 移动 可 能 得 到 较 准确 
的 特征 向 量 。 例 如 ;我 们 有 


107:(0.1000) 10™*(0.2000) 
4—0.991= .CD 
10-:(0.1000) 107:(0.4000) 


这 个 矩阵 有 特征 值 10 (0.3)》 和 10 并 0.2)， 这 是 一 个 特殊 的 例子 。 
一 般 当 和 一 21 区 | 一 44| 时 , 精确 地 计算 x 和 x 遇 到 的 困 
难 是 根本 性 的 ,不 能 用 上 述 那样 简单 的 设想 克服 。 

8. 还 有 另 一 个 方面 ,其 中 伟人 误差 也 有 着 深远 的 影响 、 例 如 ， 
假使 我 们 有 一 个 三 阶 窃 阵 ,特征 值 的 数 最 级 是 1.0,0.9 和 10 如 
采 我 们 直接 用 4 和 迭代 ,那么 在 * 次 准确 的 迭代 计算 之 后 ,m 的 成 分 
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缩减 了 一 个 因子 10~“。 可 是 每 一 个 入 的 分 量 会 人 为 1 个 二 进位 
的 效果 是 引 人 了 的 成 分 ,其 大 小 通常 为 ?nm 量 级 ， 事 实 上 , 正 
常情 况 下 将 不 会 有 任 一 个 : 位 的 x 的 近似 量 售 有 的 成 分 ， 其 值 
比 这 个 数 小 很 多 ， 这 个 评论 的 重要 性 在 下 一 节 将 变 得 明显 。 


的 变化 


和 在 逐次 迭代 中 改变 ”的 值 有 很 大 的 好 处 ， 如 果 我 们 用 
了 az; 表示 当前 的 向 量 , 那么 在 一 次 迭代 之 后 , 不 计 规格 化 因子 ， 
向 量变 为 os(% 一 8)x;。 如 果 ? 一 hs x# 的 成 分 完全 被 消去 ;如 
果 p 靠近 丸 ，x4 的 成 分 就 极 大 地 被 压缩 。 假定 我 们 已 经 达到 某 
一 阶段 ,这 时 


m= mt 十 om 十 > 5 esl & fol, ol，(9.1) 
后 


并 且 我 们 对 %; 有 某 个 估计 值 2。 取 ?一 妈 ， 我 们 有 
(A ~ Pw = ah 一生)X FT ols — hx 


+ a — Hs (92) 
由 


如 果 75 一 如 | 1 一 召 |， 最 然 当 对 某 个 让 > 2, | 生 一 姑 | > 
人 一 2 时 ， 相应 的 成 分 对 应 于 x 的 有 所 增加 , 然而 二 的 成 分 
相对 于 空 的 极 大 地 缩减 。 如 果 8 十 分 小 , 我 们 可 以 用 过 一 到 执 
行 若干 次 迭代 ,但 是 我 们 一 定 不 要 无 限制 地 继续 做 下 去 ,否则 最 终 
将 由 各 的 成 分 占 优 . 

我 们 由 实例 来 作 说 明 , 假定 一 个 4 只 矩阵 有 特征 值 1.0，0.9， 
0.2，0.1， 如 果 和 迭代 没有 原点 移动 ， z 和 x, 的 成 分 很 快 消失 ,但 是 
伟人 误差 不 确定 地 阻止 了 它们 减 小 。 假定 用 十 位 十 进位 运算 ，z 
给 定 为 


nt 110 二 10-9z + 10~axzt。 (9.3) 
在 这 个 阶段 , 我 们 对 hh 有 一 个 估计 值 0.901。 如 果 我 们 以 一 
0.901 执行 * 次 选 代 , 那 么 有 
(4 — pI) 一 (0.099)72 + 1072(—0.001)"r, 
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十 (一 0.701)710-mxs 十 (一 0.801)710-mz。 {9.4) 
< 网 成 分 很 快 减 小 。 但 是 我 们 必须 记 住 ,在 规格 化 的 wi 中 合 入 误 
差 总 是 保持 *; 的 一 个 成 分 为 10-” 数量 级， 取 r 一 4, 我 们 看 到 ， 
w+4 大 致 与 
10 0.96)m 十 10-%zi + 107°(0.24)xs + 10-°(0.41)z, 
成 比例 ,也 就 是 与 
二 109(1.04)x2 + 10-5(0.25)z 十 10-%(0.43)x， (9.5) 
成 比例 。 进一步 用 二 0.901 迭代 ，x, 的 成 分 不 再 减 小 , 而 六 和 
x 的 成 分 很 快 上 升 。 如 果 我 们 现在 取 ? 一 0，z*s 和 + 的 成 分 很 快 
消失 ,并 且 在 5,6 次 选 代 之 后 ,向 量 本 质 上 是 
x 10 me 十 10-mxi + 10-oxl (9.6) 
如 果 始 终 用 一 0, 从 《9.3) 开 始 大 概要 200 次 选 代 才 达 到 这 个 结 
果 。 当 入 越 是 靠近 时 , 这 样 的 方法 优越 性 也 就 越 大 , 但 是 要 
得 到 这 个 好 处 ,需要 有 一 个 更 接近 4 的 近似 值 . 


记 的 特别 选择 


10. 在 国家 物理 实验 室 《National Physical Laboratory) 的 计算 
机 上 我 们 研制 了 一 个 特别 的 技术 ， 其 中 ?的 值 由 操作 员 来 选 ，? 
的 值 设置 在 手动 开关 上 , 每 一 次 选 代 开始 由 计算 机 读 人 。 在 每 一 
次 迭代 之 后 , 特征 信 的 估计 值 [max(v,) 十 p] 显示 在 输出 指示 灯 
上 。 逐次 近代 向 量 “ 以 二 进位 形式 在 阴极 射线 管 上 显示 。 

这 些 程序 的 用 法 也 许 最 好 是 以 特殊 的 应 用 范围 来 说 明 。 我 们 
考虑 特征 值 全 是 正 、 实 的 矩阵 , 并 决定 其 主导 特征 值 和 特征 向 量 。 
迭代 开始 用 p 一 0。 如 果 收 敛 十 分 快 ,就 没有 必要 用 其 他 的 ? 值 ， 
但 是 如 果 收 合 不 快 ,我 们 可 以 估计 的 骏 钱 速度 。 玉 为 程序 用 定 
点 运算 , 估计 w 的 每 一 个 二 进位 数字 变 得 稳定 需要 多 少 次 迭代 ， 
这 是 容易 做 到 的 ， 假 定 每 一 位 数字 要 万 次 达 代 ， 那 么 我 们 可 以 假 
定 


(BM es py {10.1) 
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到 当前 值 fmaxtw) + P) 作为 4 我们 有 
= [max(o) + P] 二， (10.2) 


并 且 把 这 个 4, 近似值 设置 在 输入 开关 上 .。 通常 在 以 后 的 几 次 迭 
代 中 向 量 wm 显 出 十 分 高 的 收敛 率 , 但 是 x<，xe-: "的 成 分 逐渐 
地 起 更 大 的 作用 , 使 w; 中 已 经 稳定 的 数字 开始 受到 干扰 。 
实际 上 , 通常 选 代 可 以 安全 地 继续 到 wi 的 几乎 所 有 数字 都 发 
生疏 变 , 这 时 x。 的 成 分 大 概 比 的 成 分 稍 大 .然后 我 们 回 过 来 取 
也 一 0，zxs，za-+ 的 成 分 又 很 快 缩小 。 如 果 丸 和 了 很 靠近 ,为 了 
得 到 准确 的 :这样 的 过 程 要 重复 车 于 次， 已 经 证 明 , 这 种 方法 对 
丸和 为 不 是 非常 接近 的 高 阶 和 矩阵 是 十 分 成 功 的 。 实 际 上 , 值得 推 
荐 的 值 是 稍稍 小 于 (10.2) 给 出 的 值 ,因为 用 小 于 4 的 值 比 用 大 
于 恩 的 值 更 安全 。 


Aitken 的 加 速 方法 


11. Aitken《1937) 提出 了 一 个 加 速 向 量 收 伍 的 方法 ， 它 有 时 
很 有 效 ， 假 定 w，xw+r:。，%w+? 是 三 个 连续 的 选 代 量 ,并且 w, 实质 
上 是 (x 十 sxz)， 其 中 8 是 小 量 。 如 果 a 和 六 都 规格 化 使 得 
max( zz) 一 1, 那么 对 于 充分 小 的 sw 的 最 大 元 素 的 位 置 通常 与 
的 相同 。 假 定 在 *, 的 这 个 位 置 上 的 元 素 是 , 因而 会 | 拟 1, 那 
么 


《zx + sza)/(1 + ek), .Chr + esra) /Ch + ek1), 
(Hn + sdx)/ (A + ekB) (111) 
给 出 了 w，wti， wt。 现在 我 们 考虑 由 
ar = [ua — Cut PI — 2up* + f+®) 
= so— [a — ufoF /Lap — 2u8+® + +] (11.2) 
定义 一 个 向 量 “的 分 量 , 其 中 sw 表示 w? 的 第 i 个 分 量 。 用 
(11.1) 代 人 ,并 记 和 /1% 一 ">， 作 些 简化 后 ;我 们 有 
sl(1 — r) (x ~— krl) (x — Errkx}”) 
(1 一 r(x — Xe)(1 一 et) 


a 


(11.3) 
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= [x 81RD [1 一 sm]， (11.4) 
得 册 4 一 为 十 Ofs)， (11.5} 
因为 4; 的 分 母 和 分 子 都 有 因子 。。 世 许可 以 认为 禾 代 过 程 将 
受到 舍 人 误差 的 严重 影响 。 但 是 事实 并 非 如 此 , 如 果 ww，w+: 和 
m4 有 误差 24, 28 和 27 那么 忽略 类 似 于 2-"'s 的 项 , 等 式 (11.3) 
变 为 
人 
el1 — r(x? — hz}d) (#0 一 er ka) + p20 十 了 一 20) 
sl — r(x — ko) eRr) ta (otr—28) 


(11.6) 
我 们 可 写 为 


4 
这 显示 出 合 人 误差 的 影响 是 微不足道 的 。 

因此 , 当 泛 代 进行 到 某 个 阶段 ,除了 志和 外 ,所 有 特征 向 量 
都 已 消去 时 ，Aitken 过 程 给 出 的 向 量 比 已 导 出 的 向 量 更 加 接近 
aa。 可 是 ,如 果 t, 和 2 不 是 明显 分 离 ， 要 使 的 成 分 与 二 相 比 
可 以 忽略 ,需要 非常 多 次 效 代 . 

设计 一 个 有 效 的 Aitken 方法 的 自动 程序 是 十 分 困难 的 。 在 
国家 物理 实验 室 我 们 设计 了 一 个 特别 的 程序 ，Aitken 过 程 由 操作 
员 控制 ,他 可 以 册 一 个 输入 开 半 发 出 指示 ,在 一 次 迭代 结束 时 使 用 
加 速 方法 和 通过 观察 向 是 迭代 的 性 质 ， 他 可 以 判断 加 速 法 是 否 有 
利 . 一旦 发现 Aitken 方法 对 确定 当前 的 向 量 并 无 收益 时 则 放弃 
尽管 自动 程序 设计 是 困难 的 ,我 们 发 现 这 种 方式 使 用 Aitken 方法 
是 十 分 有 价 信 的 . 


复 共 堪 特 征 值 


12. 如 果实 矩阵 的 主 特征 值 是 复 共 孝 对 44 和 思 。 迭代 就 不 收 
伍 ， 事 实 上 ,如 果 入 是 对 应 的 特征 向 最, 任 一 实 向 量 m 可 以 
表示 为 


3 (11.7) 
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加 max 十 BR 十 立 jx。 (12.1) 
3 
因此 ,我 们 有 
A'im = rfpre't ex + pre "etx 十 bp obra |, (12.2) 
和 
其 中 ht, a= pe {12.3) 
xm 的 成 分 最 终 消失 ,但 是 如 果 我 们 写 
vn Asss max(vin) 一 kr, 
Wt vf ks (12.4) 
从 (12.2) 组 显然 ts 和 wrs 都 不 趋向 于 极限 ;如 果 我 们 用 莒 ce 全 表 
示 和 如 的 第 7 个 分 量 ,等 式 (12.2) 给 出 
(Aitm)i; ~ 2priticos (a + pi + 10), (12.5) 
丙 此 ，xw 的 分 量 的 符号 发 生 摆动 。 
如 果 罗 和 加 是 如 一 84 一 g 一 0 的 根 , 我 们 有 
《4 一 Ph 一 qh) 而 一 00 一 co)， (12.6) 
或 者 
kapha 一 PRiritst — gus 一 0 (12.7) 
办 此， 最 终 任何 三 次 连续 迭代 是 线性 相关 的 。 由 最 小 二 乘法 可 以 
决定 逼近 ”和 9 的 值 户 和 9、 我 们 有 


Ga ar 
A | i -| | | (12.8) 


T, T 
Wy Wst+2. 了 Ws Hs Ea 


当 包 和 4, 趋向 于 极限 和 4 时 ,2 和 及 可 以 由 关系 
家 (一 二 加 CD 一 二 人 十 4 《129) 


决定 。 
13、 大 为 它们 是 从 一 个 显 式 多 项 式 方程 得 到 的 ， 当 二 根 接近 
于 ， 即 在 .7 () 是 小 量 的 情况 下 ， 从 系数 ?和 4 确定 2 和 天 是 
不 准确 的 。 世 许 认为 ,特征 值 的 精度 损失 可 归罪 于 原 问 题 的 病态 ， 
但 是 这 不 一 定 是 对 的 。 
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例如 , 考 碰 矩阵 4: 


0.4812 0.0023 
。 (13.0 
一 0.0024 0.4810 |} 


特征 值 是 0.4811 士 0.00231* 并 且 可 以 验证 它们 对 于 矩阵 4 的 元 素 
的 小 摄 动 不 大 敏感 。 可 是 其 特征 方程 
业 一 0.962214 十 0.23146272 一 0 

的 报 , 对 它 的 系数 的 独立 的 改变 非常 敏感 ,因此 ,尽管 用 $ 12 的 方 
法 很 精确 地 决定 了 ? 和 4, 但 是 所 给 出 的 特征 值 的 蕊 部 不 准确 .下 
憾 的 是 ,在 这 种 情况 下 ,方程 (12.8) 恰巧 是 病 杰 的 . 

逢 阵 (13.1) 可 作为 一 个 好 的 说 明 。 因为 这 是 二 阶 的 。 我 们 可 
取 任 一 个 向 量 作为 4,。 如 果 取 好 一 (1, 1)， 那么 用 4 位 十 进位 
运算 ,我 们 有 


(Aus)’ = (0.4835, 0.4786), 
Ami)T = (0.2338,0.2290). (13.2) 
因为 只 有 两 个 分 量 , p 和 4 被 唯一 决定 ,并 且 我 们 有 
0.2338 一 0.4835p 十 9， 
0.2290 一 0.4786p 十 9， 
得 出 
f = 0.9796, 4 一 一 0.2398。 (13.3) 
当然 ,准确 的 计算 给 出 准确 的 P, 9。(13.3) 中 的 p。4 值 对 于 决定 
刀 豪 无 用 处 。 


复 特征 向 重 的 计算 
14. 当 %，…，z 的 成 分 已 经 消失 时 ,我 们 有 


Ws 一 x 十 Fx, 


ven Au = ox + Bz (14.1) 
如 果 我 们 写 
ex 一 2 十 jp de b+ jms (14.2) 
那么 
Wy = Zo Vers = ZE121 一 Zsy (14.3) 
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iw ~ 十 [w+ im vu) ml, (14.4) 


不 计 规 格 化 因子 有 
x = ts + (Es — 1), (14.5) 
若 加 小 , 则 ww 与 vot 几乎 平行 , 因此 向 量 x 测定 不 准确 , 这 一 点 
在 $13 的 例子 中 也 得 到 了 说 明 。 注意 ,(siwi) 是 不 变 子 空间 (第 
三 章 $ 63) ,因为 等 式 
(aa 二 ia = (b+ in) (2 + iw), (14.6) 
意味 着 
Az = 一 一 {14.7) 
因为 一 个 实 特征 值 有 一 个 实 特征 向 量 , 郧 虑 部 为 零 的 向 量 , 可 
以 设想 ,如 果 小 ,规格 化 使 max(n4) 一 1 十 和 时 ， 向 量 x 的 感 
部 将 是 小 的 。 可 是 。 这 是 不 对 的 , 除非 存在 一 个 接近 4 的 矩阵 ,并 
且 它 有 接近 【2 一 1 的 实 二 次 因子 。 例如 
zxT = (—0.0417 一 i0.9782, 1 + i0). (14.8) 
给 出 (13.1) 的 矩阵 的 规格 化 特征 向 量 z+.。 我 们 得 到 这 个 矩阵 的 坏 
结果 ， 并 不 是 因为 我 们 选择 地 为 《1,1), 几乎 任 一 个 向 量 都 会 给 
出 同样 环 的 结果 
如 果 我 们 研究 实 矩 阵 有 一 个 实 主导 特征 值 对 应 两 个 特征 向 量 
的 情况 ,问题 就 清楚 了 。 显然 ,我 们 不 可 能 从 一 个 简单 的 序列 m， 
纪 ，za … "得 到 这 两 个 特征 向 量 , 我 们 仅 能 在 一 个 恰当 的 子 空间 上 
得 到 一 个 向 量 。 这 是 复 共 轿 特征 值 对 (土语 ) 当 四 一 0 时 相对 
应 的 情况 ,初等 因子 保持 线性 。 


原点 移动 


15. 显然 , 用 任何 实 的 值 ,进行 (4 一 好 ) 的 迭代 不 可 能 “分 
离 " 出 一 对 复 共 轿 特征 秽 量 ， 可 是 ,如 果 取 复 值 p, 用 复 向 量 选 代 ， 
那么 (4 一 P) 和 (% 一 加 的 模 是 不 同 的 ， 有 可 能 收敛 于 =。 现 
在 每 次 迄 代 工作 量 增 至 二 以 ， 但 是 这 是 很 合理 的 , 因为 当 找到 4 
和 就 立即 得 到 和 4, 训 。 在 这 种 情况 下 值得 注意 的 是 ,用 512 的 


«600% 


方法 决定 一 对 复 共 胃 特 征 向量 只 要 计算 一 个 实 向 量 所 需 的 运算 
基 . 

我 的 经 验 是 用 复 的 移动 不 是 十 分 好 的 ， 因 而 建议 最 好 用 $12 
的 方法 取 实 的 移动 ， 并 且 保 持 双 精度 的 向 量 w， 因 为 4 的 元 素 是 
单 精度 的 ,这 样 做 需要 的 运算 量 仅仅 是 用 单 精度 向 量 的 两 售 , 从 得 
到 两 个 特征 值 的 观点 来 看 ,这 是 一 个 十 分 合理 的 比例 。 可 以 验证 ， 
如 果 mi > 天 十 4， 那么 双 精 度 向 量 完全 能 克服 我 们 讨论 过 的 
病态 ,但 是 为 获得 全 部 的 好 处 ,我 们 必须 继续 迭代 , 直到 其 余 的 特 
征 疝 量 的 成 分 为 2-* 量 级 ,而 不 是 2 数量级。 


非 线性 初等 因子 


16. 当 4 有 非 线性 初等 因子 时 。 我 们 用 单个 Jordan 子 和 矩阵 
Cr(e) 《第 1 章 57) 作为 4 来 说 明 简单 军法 的 性 质 ， 我 们 有 


[coOTam i a i 


s 
十 … 士 (1) dle + er, (16.1) 


显然 , 当 * -> co 时 , :的 项 占 优 ,但 是 收 伍 慢 , 因 为 《16.1) 的 右边 
可 写 为 

(yz 4 [a+ Tat ]: (16.2) 
方 括号 内 的 项 渐 近 为 


tl ee (16.3) 


从 任何 向 量 ww 开始， 最终 确 实 收 化 于 唯一 的 疝 量 61, 但 是 渐 近 收 
伍 性 比特 征 值 不 相同 但 分 离 不 明显 的 情况 恤 。 可 是 渐 近 收敛 率 可 
能 使 人 迷惑 。 如 果 «小 ,在 (16.3) 中 e 的 项 也 小 。 这 个 篇 易 的 评 
论 对 于 逆 迭 代 (§ 53) 是 重要 的 . 
现在 我 们 回 到 一 般 的 情况 ,我 们 有 
A'= XCK™!, (16.4) 
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其 中 C 是 Jordan 标准 型 。 如 果 4 的 主 特 征 值 是 如 ， 它 的 初等 因 
子 是 7 次 的 , C.(4) 是 在 Jordan 型 C 中 的 第 一 个 子 矩阵 ,那么 对 
任何 mw, 假 若 X-'mw 的 前 7 个 分 量 不 全 为 零 , 就 有 CX wo ~ er。 
于 此 

4 一 《16.5) 
通常 ,对 于 实际 使 用 来 说 ， 这 个 收敛 性 是 太 慢 了。 但 是 我 们 注意 
到 ,对 应 于 模 较 小 的 特征 值 4 的 不 变 子 空间 的 成 分 在 * 次 迭代 后 ， 
缩小 一 个 因子 (4/4.)', 所 以 我 们 很 早 就 保留 了 一 个 向 量 在 对 应 
于 丸 的 子 空间 中 。 在 $532, 41, 53 中 , 我 们 还 要 讨论 非 线性 因子 
的 情况 . 


同时 决定 几 个 特征 值 


17. $ 12 中 的 方法 的 基本 特点 是 由 一 个 迭代 序列 决定 两 个 特 
征 值 。 特征 值 是 复 共 因 的 情况 只 是 附带 的 , 这 种 方法 可 以 扩展 到 
决定 几 个 实 的 或 是 复 的 特征 值 。， 例 如 ,假定 

la bi 1 1 (17.1) 
在 迭代 向 量 中 , x 到 x。 的 成 分 很 快 消 失 ， 并 且 过 程 很 快 达到 能 用 
ti 十 om 十 oz 表示 。 如 果 用 等 式 
QQG— HB) d+ hr (17.2) 
定义 数量 户 , P,P,， 那 么 
(Bt thA+ hw— 0 (17.3) 


给 出 
ps 


P 
[2 
所 以 , 可 以 用 最 小 二 乘法 从 w% 之 后 韦 续 的 四 次 迭代 证 得 到 

当 11，|4|，1%| 靠近 时 , 这 种 方法 是 值得 推荐 的 。 因为 
在 这 种 情况 下 , 收 丝 于 主导 特征 向 量 的 迭代 是 慢 的 。 可 是 如 果 2， 
5, 同 号 ,并且 紧 洁 在 一 起 ,那么 不 但 相应 的 多 项 式 是 病态 的 ,而 
且 决 定 的 方程 也 是 病态 的 , 因此 ,这 个 方法 没有 什么 实用 价值 。 
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— [aw] = [Mw Aw,in,] (17.4) 


Krylov 方法 (第 6 章 $ 20) 就 是 带 有 所 有 这 些 限制 的 这 种 方法 , 一 
般 来 说 ， 在 良 态 的 情况 下 决定 7 个 特征 值 需要 * 个 独立 的 选 代 向 
重组 。 在 $36 ~$39 中 我 们 讨论 这 种 方法 。 


复 矩阵 


48 如果 和 矩阵 4 是 复 的 。 那 么 我 们 可 以 始终 用 复 运算 进行 简 
单 和 迭代 ， 但 是 每 一 次 选 代 的 运算 量 增 至 四 倍 。 可 以 用 揽 的 原点 
移动 但 是 选择 这 样 的 移动 值 一 般 是 十 分 困难 的 .通常 ,完全 依靠 
《4 一 P1) 型 矩阵 的 迭代 来 获得 一 个 复 矩 阵 的 主导 特征 向 量 是 不 
适当 的 。 在 $62 未 我 们 再 介绍 另外 的 方法 。 


收编 法 


19. 我 们 已 经 看 到 ， 在 婚 阵 《是 实 的 。 特征 值 也 是 实 的 情况 
下 ,可 以 用 实 的 原点 移动 得 到 欧 向 于 和 或 是 4。 的 收敛 竹 ， 在 复 矩 
阵 的 情况 下 ,原则 上 用 适当 的 原点 移动 使 得 许多 特征 依依 次 占 优 ， 
但 是 通常 很 难 实现 . 

自然 要 间 。 我 们 能 否 利用 已 知 的 入 去 导 找 别 的 特征 向 
量 , 并 且 各 免 再 收 全 于 = 的 危险 ， 回 答 是 肯定 的 ， 有 一 类 这 样 的 
方法 ,其 本 质 是 用 一 个 仅 含有 册 下 的 特征 值 的 矩阵 来 代 葵 4. 我 们 
称 这 类 方法 为 收入 法 。 

最 简单 的 方法 是 属于 Hotelling 《1933) 的 方法 ， 它 可 用 于 对 
称 短 阵 4, 的 特征 值 4 和 特征 向 量 = 都 是 已 知 的 情况 ， 我 们 定义 
4 为 


zf 1，40 王 4 一 入 zitrj (19.1) 
从 专 的 正 交 性 ,我 们 有 
A 一 A — hrrlr 一 0 (i=1) 
hoi 1). 
因此 ,4; 的 特征 值 是 0,"，,2s, 对 应 的 特征 向 量 是 ;x x， 
原 主 导 特征 值 4 已 经 化 为 零 . 
当 4; 是 非 对 称 矩 阵 时 ，Hotelling (1933) 也 给 出 了 收缩 方法 ， 
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(19.2) 


但 是 除了 ma 之 外 ， 还 要 定 出 左 特 征 向 量 为 。 如 果 都 规格 化 使 得 
yx 一 1， 那么 4, 决定 为 
A A — hxyT, (19.3) 
从 二 和 为 的 双 正 交 性 ,我 们 有 
4 Aiti 一 hrylxi = 0 (i=1) 
= bm G1). 
这 两 个 收编 方法 的 数值 稳定 性 都 不 好 ,我 们 不 推荐 使 用 它们 . 


用 相似 变换 的 收缩 法 


20. 现在 我 们 研究 以 4, 的 相似 变换 为 基础 的 收缩 法 。 假定 
日 ,是 某 个 非 奇异 矩阵 ,使 得 


(19.4) 


Hn ~ btss (20.1) 
显然 名 到 0. 我 们 有 
A = ma。 给 出 本 4, (HTH) 一 En (20.2) 
等 式 (20.1) 和 {20.2) 给 出 
HAiHi'e, = Ue, (20.3) 
因此 三 41H7! 的 第 一 列 必定 是 hc。 我 们 可 以 写 
Ai = HiAiHr' ~ 上 二 | (20.4) 
Ot!B, 


其 中 B, 是 (2 一 1) 阶 和 矩阵 ,显然 有 特征 值 ja … lo。 为 了 寻找 。 
特征 值 2 我 们 可 以 用 了 进行 用 雪 ? 表 示 B; 的 对 应 的 特征 向 量 
然后 写 出 


2 | 如] = 
了 | 总 | 一 2 加 一 4x9 (比如 说 ),(20.5) 


01B 几 x x 
我 们 有 
(ho— he + br? = 0 {20.6) 
最 后 ,从 (20.4) 得 到 
z= Hrixi?, (20.7) 


因此 ,我 们 能 够 从 8, 的 特征 向 量 容易 地 决定 4 的 对 应 的 特征 向 
量 . 
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在 决定 B: 的 特征 向 量 so 之 后 , 我 们 用 类 似 的 方法 定 出 号 
使 得 


ax = kess (20.8) 
得 到 
.157 
BBH7: 一 [2 (20.9) 
0 1B, 


其 中 B 是 (x 一 2) 阶 的 ,有 特征 值 %,,-…,4,。 我 们 从 B 的 特征 
向 基 x 名 可 以 决定 B, 的 特征 向 量 x 名 ,然后 得 到 本 41H7' 的 向 量 
次 ， 因 而 最 终 得 到 4 的 特征 高 量 =:。 继续 下 去 ， 我 们 可 以 找到 
4 的 全 部 特征 值 和 特征 向 量 。 如 果 我 们 写 


7 0 
K= | (20.10) 
olg, 
那么 我 们 得 到 
Tec， 
Kr eKKAIKT KI Kr | |, 20.11) 
0 IB 


其 中 了 7, 是 上 三 角 和 矩阵 ,对 角 元 是 4,…, 4,，。Bwl 有 特征 值 pr， 
…*，4o。 所 以 逐次 收 纹 法 给 出 了 一 个 相似 变换 约 化 矩阵 为 三 角 
型 (第 一 章 $542, 47)。 


用 不 变 子 空间 的 收编 法 


21. 在 详细 研究 这 种 收缩 法 之 前 ,我 们 讨论 一 个 特殊 惜 况 ， 假 
设 我 们 已 定 出 4 的 一 个 不 变 子 空间 (第 三 章 $ 63)， 但 是 不 一 定 是 
特定 的 一 些 特征 向 量 。 假 定 我 们 有 和 抵 阵 X, 它 有 线性 无 关 的 m 
列 ， 和 一 个 吓 X 畏 短 阵 M ,使 得 

AX = XM. (21.1) 
进一步 假定 甩 是 非 背 异 和 矩阵 ,使 得 


7 
HX 一 村 | (21.2) 
O 
其 中 T 是 m x m 非 奇异 乱 阵 (实际 上 通常 是 上 三 角 型 )。 如 果 我 们 


写 
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ic 
HAH™:= [| (21.3) 
lz 
那么 从 关系 
HAH-'HX 一 HXM, (21.4) 
我 们 有 
Bic1Tz 了 
-一 -十 一 | 过] 一 全 |] M。 (215) 
pilE jlo O 
由 此 得 
BT—TM 和 DT- 0, (21.6) 


从 第 二 个 关系 式 得 D 一 0， 因 此 4 的 特征 信和 是 的 和 E 的 特征 
值 的 全 体 。 从 (21.6) 的 第 一 个 等 式 可 知 ,也 的 特征 值 又 是 M 的 特 
征 值 . 


用 稳定 初等 变换 的 收缩 法 


22. 现在 我 们 回 到 已 知 单个 特征 向 量 ”m 的 情况 ,我 们 需要 一 
个 满足 (20.1 ) 的 矩阵 本 。 我 们 可 以 用 一 个 稳定 的 NiJiw 形 的 彝 
积 决 定 BH， 其 中 “的 最 大 模 元 素 在 1 位 置 。 假定 和 已 规格 化 ， 
使 max(x 一 1， 收 缩 法 的 步骤 如 下 。 

GD 交换 4, 的 第 1 行 和 第 1 行 ,第 1 列 和 第 工 列 . 

《ii) 交换 的 第 1 元 索 和 第 1 元素, 把 所 得 的 向 量 称 为 。 

(ii) 对 i 从 1 到 x 计算 

第 ; 行 一 第 ; 行 一 (ys x 第 1 行 )。 

(iv) 对 从 2 到 ”计算 

第 1 列 一 第 1 列 +(m Xx 第 ; 列 ). 

实际 上 , 步 (iv) 不 必 执 行 ;因为 我 们 已 知 第 1 列 必 定 变 成 (1 
0，…。0), 所 以 在 收缩 法 中 仅 有 (* 一 17 次 乘法 。 注意, 对 这 种 
收缩 法 ,等 式 (20.4) 中 的 红 由 4 的 第 1 5 行 的 元 素 组 成 , 只 是 以 明 
显 的 方式 置换 的 ou 除外， 此 外 ， 即 使 4 是 对 称 的 ，A; 一 般 不 
保持 对 称 狂 。 

23. 当 我 们 像 在 $21 那样 有 一 个 不 变 子 空间 X 时 ,我 们 希望 
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决定 一 个 满足 (21.2) 的 妞 。 这 又 可 用 稳定 的 初等 变换 很 方便 地 
实现 . 一 个 适当 的 玉 可 以 确定 为 汪 积 

Ta (23.1) 
其 中 各 个 矩阵 恰 是 对 矩阵 乏 施行 交换 的 Gavss 消去 法 可 得 到 的 短 
泗 ( 它 只 有 双 列 ,而 不 是 " 列 , 但 这 是 无 关 紧 要 的 ). 显 然 , 我 们 有 


了 
Nal mm Nalsr Nl 一 上 | (23.2) 
0 


其 中 了 是 上 三 角形 的 。 如 果 不 需 要 交换 , 吾 的 形式 是 


GG 


如 果 XT 是 [UiV]，(23.2) 等 价 于 
LU=7T 和 MU+V=0. (23.3) 
HA4HT! 的 计算 有 m 步 ,在 第 步 中 ,用 矩阵 NTn 执行 相似 
变换 。 注意, 我 们 不 必 计算 (21.5) 中 用 局 表示 的 收缩 后 的 那 部 分 
矩阵 ,因为 我 们 已 知 它 应 该 是 零 . 因 为 在 开始 收缩 之 前 我 们 有 了 关 
于 交换 的 全 部 信息 ,我 们 知道 4 的 那些 行 和 列 产 生子 矩阵 了， 很 
容易 设计 计算 过 程 ， 使 得 在 决定 日 ( 像 所 有 交换 的 三 角 分 解 那样 》 
和 计算 收缩 的 矩阵 中 用 内 积累 加 。 
24. 使 用 不 变 子 空间 的 最 普通 的 例子 是 发 生 在 有 复 特 征 值 对 
的 矩阵 ， 如 果 我 们 用 $12 的 方法 ,那么 在 出 现 收敛 之 后 ,任何 两 个 
接连 的 ,和 ws 组 成 一 个 不 变 子 空间 。 
当 复 特征 向 量 (zs: 十 zwi) 已 经 确定 时 , 这 个 收缩 法 有 一 个 很 
有 意义 的 畦 点 .假定 (m 十 jwa) 已 规格 化 ,使 得 max(*) 一 1 十 
0i。 当 nm 5，1' 一 3 时 我 们 有 
si (a el 1 a qs), 
WIi=(bh Bb 0 6b 55)， 
第 一 次 交换 给 出 
1 a a dd as 于 
|， 所 玉 站 2] -| 曲 基 区 本 


(24.1) 


]， (24.2) 
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在 入 中 我 们 有 mw 一 a/。 * 的 第 一 列 的 约 化 保持 第 二 列 不 受 影 
响 , 第 二 列 以 后 用 War 左 乘 独立 地 约 化 。 实 际 的 效果 是 首先 把 
二 作为 实 特征 向 量 处 理 并 执行 一 次 收缩 ,然后 把 w:《 连 同 省 略 的 
零 元 ) 当 作 收缩 后 的 矩阵 的 特征 向 量 处 理 并 执行 另 一 次 相应 的 收 
缩 ， 


用 瑟 变 换 的 收编 法 


25. 类 似 地 ,我 们 可 以 用 本 变换 实现 收缩 法 ， 在 单个 向 量 的 情 
况 下 ， 等 式 〈20,1) 的 矩阵 万 可 选 定 为 单个 初等 Hermite 拖 阵 
《1 一 2wwT)， 其 中 必 通 常 没有 零 分 量 ,或 者 选 定 为 在 平面 (1, 2)， 
(1，3),…。(1, 9) 上 的 旋转 的 乘积 。 如 果 x 是 实 的 , 这 些 和 矩阵 是 
正 交 的 ， 

如 果 用 平面 旋转 ， 一 次 收缩 大 约 有 8m 次 乘法 ; 如 果 用 初等 
Hermite 矩阵 , 有 4m 次 乘法 。 这 给 出 通常 的 2 比 1 的 比率 ,平面 
旋转 并 没有 什么 益处 ,可 是 , 用 初等 Hermite 矩阵 的 过 法 量 是 稳 
定 的 非 西 变换 的 四 倍 ,在 上 述 情 况 中 比例 已 是 2 比 1, 这 是 因为 在 
收缩 时 用 稳定 非 西 变换 ,我 们 实际 上 不 必 执 行 用 Hi 后 右 乘 。 在 
和 任何 情况 下 ,最 后 "一 1) 列 保持 不 变 ,并 且 我 们 不 用 计算 就 置 第 
一 列 为 het。 虽然 在 西 变 换 中 我 们 最 后 可 令 第 一 列 为 Aer, 但 是 
这 样 做 节省 不 了 多 少 计算 量 , 因 为 在 右 乘 对 其 他 的 列 都 要 修改 。 

如 果 厦 矩阵 是 Hermite 矩阵， 那么 收编 后 的 矩阵 也 是 
Hermite 矩阵 ,并 且 形式 为 


其 中 B 是 Hermite 矩阵 。 收缩 法 可 以 用 儿 平 与 第 五 章 $ 30 描 
述 Householder 方法 的 第 一 步 相 同 的 方式 实行 (除了 ww 第 一 个 
元 素 不 是 零 之 外 )。 有 意思 的 是 ，Feller 和 Forsythe(1951) 首先 
描述 这 个 用 初等 Hermite 矩阵 的 收缩 法 ,只 是 他 们 用 的 术语 不 同 。 
可 懂 没 有 引起 人 们 充分 的 注意 〈 也 许 因为 它 只 是 该 文中 很 多 聊 缩 
法 中 的 一 个 )， 否 则 在 数值 分 析 的 矩阵 研究 历史 中 可 以 导致 更 早 
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更 广泛 地 使 用 初等 Hermite 矩阵 。 

类 似 地 ,对 于 由“ 列 张 成 的 不 变 子 空间 ,我 们 可 以 按照 正 交 三 
角 化 (第 四 章 $46) 中 处 理 方 阵 的 前 列 一 样 对 待 它 。 这 需要 二 个 
初等 Hermite 矩阵 ,其 向 量 几 分 别 有 0, 1, 2,…， mm 一 1 个 零 元 。 
对 应 的 矩阵 了 还 是 上 三 角 型 的 。 关于 实 矩阵 的 一 个 复 特征 向 量 
《ma 十 zu) 我 们 用 实 的 不 变 子 空间 〈zatm), 因 而 只 用 实 ( 正 交 ) 矩 
阵 : 不 涉及 揽 运 算 。 


数值 稳定 性 


26. 5 22 和 $25 的 收缩 法 都 非常 稳定 。 假 设 向 时 w 已 被 接受 
作为 一 个 特征 向 量 ， 并 且 1 一 max(4m) 作为 特征 值 ， 为 了 简化 
记号 ,这 里 省 去 足 标 *。 不 失 其 一 般 必 ,我们 假定 % 的 极 大 模 元 素 
在 第 一 个 位 置 ， 我们 写 出 

A — lu = {26.1) 
且 假 定 |imj 与 141 相 比 是 小 量 .可 是 ,第 三 章 的 (53.6) 和 第 二 章 
$ 10 证明, 这 并 不 意味 着 * 一 定 是 高 精度 的 。 的 确 ,如 果 有 多 于 一 
个 特征 值 接近 4、 这 个 * 可 能 是 一 个 精度 很 低 的 特征 向 蚤 ， 如 果 
我 们 写 


| a 
a | 二 元 ,1 62) 
eo 1B, 
那么 
110 
六 一 Ea (26.3) 
—vir 
现在 用 4 表示 计算 的 收缩 矩阵 ,我 们 有 
1 | 上 
4 一 | (264) 
0!8, 


其 中 只 有 8 的 元 素 是 实际 计算 的 。 例 如 ,用 定点 计算 ,我 们 有 


1 )- 
人 一 一 4 二 


* 原文 误 为 2 一 译 者 注 


(1<i jn), (26.5) 
由 此 得 
Bi Bi— vart F, (26.6) 
其 中 是 由 8; 形成 的 矩阵 。 现在 考虑 用 计算 的 4; 定义 的 矩阵 
,其 关系 是 


| (26.7) 


[a Bi— FABtF 
计算 的 4 与 和 有 完全 相同 的 特征 值 , 并 且 显然 , 甸 有 1 和 x 作 
为 准确 的 特征 值 和 特征 向 量 。 所 以 ,我 们 可 以 说 ,计算 的 4; 是 先 
导 找 3, 的 一 个 准确 特征 值 和 特征 向 量 ， 然 后 实施 准确 的 收缩 得 
到 的 抵 阵 。 我 们 希望 建立 站 和 4 的 关系 , 记 条 一 (和 入), 等 式 


(26.1) 给 出 
autav— lm c+Br——t, (26.8) 
因而 
~ au—m} a 
二 一 | 二 一 -|--------~ -| 《26.9) 
ec 一 上 一 Po lB+F 
—m io 
笃 一 和 4 一 [=| {26.10) 
一 ?一 Fr PF 
可 以 得 到 


Hz 一 4 < la 十 去 人 一 D2 C2611) 


假定 剩余 3 是 小 量 ,我 们 可 以 肯定 ,即使 4 可 能 与 用 准确 的 * 导 
出 的 矩阵 差别 很 大 ，A4; 的 特征 值 必 定 接近 4 的 特征 值 (如 果 它 
们 是 良 态 的 )。 

如 果 我 们 考虑 一 系列 收缩 ， 那 么 存在 一 个 危险 ， 就 是 逐次 的 
44 的 元 素 可 能 逐步 增 大 , 矩阵 可 能 变 得 愈 来 愈 病态 ， 早 在 使 用 一 
系列 稳定 的 非 西 变换 时 , 这 一 问题 已 引起 我 们 的 注意 ， 在 目前 这 
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一 特殊 情况 下 ， 这 个 危险 似乎 比 在 一 般 的 情况 下 的 小 .实际 上 在 
每 一 次 收缩 时 。 我 们 只 对 4, 的 右 下 角 的 矩 阵 3, 作 计算 ,通常 随 着 
7 增加 B, 的 条 件 改善 ,甚至 对 4, 不 成 立时 也 是 如 此 。 一 个 收缩 
的 例子 是 4, 有 一 个 二 次 因子 .如果 忽略 了 合 人 误差 ， 每 个 4 必 
定 有 二 次 因子 ， 但 是 如 果 已 找到 它 的 一 个 特征 值 以 后 。B, 就 四 没 
有 二 次 因子 了 ， 因此 ,特征 信 对 其 中 剩 下 的 一 个 的 条 件 必定 已 被 


改善 。 
数值 例子 
27. 在 表 1 中 我 们 显示 了 一 个 三 阶 矩 阵 的 收缩 法 。 从 给 出 的 
家 1 


A Er 2 
| 0.987 0.400 | W005 1.000 1.0 110 


—0.079 0.500 0.479 | X0900 0.143 1.0 一 1.0 
0.082 0.400 0.418 」 刀 一 0.100 0.286 1.0 1.0 
旦 = [1.000 0.200 0,3333 一 计算 的 zi。 

2 一 10- 并 一 0.171 一 0.498 -0-1?1] 一 剩余 向 量 

0.905 0.400 一 0.487 
wan 0.420 se ke em 
0 0.267 0.580 Ja; =0.100 
0.905 0.400 一 0.487 
较 准确 的 “-| D 0.443 ve] 
v 0.286 -0.557 
0.987 171 0.400 000 一 0.487 000 
-|e 373 800 0.500 000 0.478 | 
0.082 187 943 0,400 200 -0,417 829. 
转 置 的 计算 的 3， 的 特征 商量 一 [1.000，0.833] 一 [x] 
0.905 0.400 一 0.487 
计算 的 “| 0 0.900 ws | 


0 0 0.100 
计算 的 x zs ’ 
1.000 0.750 1.000 
0.200 1.000 一 1-000 
0.333 0.958 1.000 
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特征 信和 特征 向 量 可 看 出 ，X, 和 2, 是 接近 的 。 对 于 向 量 ww， 虽然 
它 的 十 进 制 第 二 位 有 误差 ,但 是 已 被 接纳 为 特征 向 量 ,并 得 出 较 准 
确 的 特征 值 和 小 剩余 向 量 ， 计 算 的 收缩 矩阵 与 用 准确 计算 的 算 阵 
有 本 质 上 的 差别 ， 但 是 2 和 为 已 达到 运算 精度 。 向量: 是 入 的 
准确 的 特征 向 重 ， 乞 的 准确 收缩 给 出 计算 的 4;。 因此 , 计算 的 
4 的 特征 值 是 饼 的 准确 值 ， 我 们 注意 到 , 94, 十 分 接近 4,， 我 们 
从 计算 的 4 中 的 2X 2 矩阵 B; 决定 第 二 个 特征 值 。 因为 它 有 二 
个 明显 分 离 的 特征 值 ， 其 特征 调 量 是 好 定 的 因此， 选 代 确 实 
导出 B; 的 较 准确 的 将 征 向 量 。 表 中 展示 了 计算 的 4:, 并且 最 后 
给 出 4: 的 三 个 计算 的 特征 向 量 。 计算 的 wy 是 不 准确 的 ， 不 过 这 
是 我 们 预料 到 的 。 它 的 不 准确 性 不 能 完全 归罪 于 收缩 法 。 它 的 精 
度 不 低 于 用 原 和 矩阵 计算 的 m。 此 外 , 计算 的 mm 和 x 张 成 的 子 空间 
是 相当 准确 的 。 事实 上 ,计算 的 x9 与 正确 的 x 在 运算 精度 内 是 
一 致 的 ,这 是 因为 在 nu.，xs 的 子 空间 中 第 一 个 分 量 是 零 的 向 量 是 
好 定 的 。 另 一 方面 , 用 “很 低 精度 ”收缩 得 到 的 x 也 准确 到 运算 精 
度 ， 这 也 是 我 们 预料 中 的 ， 因 为 x 是 良 态 特征 向 量 , 在 第 一 次 收 
缩 中 产生 的 误差 与 用 各 代替 4, 作 计算 是 等 价 的 。 

从 B; 的 特征 向 量 得 到 x, 我 们 有 
1.000 
0.200 1.000 
0.333 0.833 |» 
其 中 e 由 4x; 和 jz 的 第 一 个 元 素 相等 来 决定 。 这 给 出 

加 一 丸 十 上 ff 一 0.005671) 或 者 —0.005 =a(—0.005671). 
注意 , « 是 由 两 个 小 量 的 比 来 决定 的 。 这 一 定 是 4; 有 靠近 的 特征 
值 但 不 接近 有 非 线性 因子 的 矩阵 的 情况 。 在 极限 的 情况 下 , 4 和 
加 相等 ,但 是 心 有线 性 因子 , x 的 系数 ( 即 srx?) 是 准确 的 零 ， 这 
说 明 e 是 任意 值 ， 这 正 是 我 们 预想 的 。 当 4 有 一 个 二 次 因子 时 ， 
ax 名 不 是 零 , 因此 实际 上 % 一 二， 因而 我 们 仅 得 到 一 个 特征 向 
量 , 这 向 量 浆 ' 给 出 在 公 的 对 应 于 该 二 次 因子 的 子 空 间 中 的 一 个 
独立 向 量 。 
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本 变换 的 稳定 性 


28. 可 以 设想 , $25 的 西 收缩 法 也 是 十 分 稳定 的 , 并 且 不 会 发 
生 闵 次 收缩 的 矩阵 元 素 增 大 ,矩阵 念 变 愈 病态 等 危险 ,在 这 个 分 析 
中 , 没有 新 的 内 容 。 我 们 再 次 注意 到 , 2 和 w 是 (4 一 su7) 的 准 
确 的 特征 值 和 特征 向 量 , 办 而 第 三 章 的 一 般 性 分 析 立 刻 就 可 应 用 。 
关于 定点 , 有 内 积累 加 的 计算 分 析 已 经 由 Wilkinson (1962b) 给 
出 ， 

对 于 用 浮 点 累加 运算 的 初等 Hermite 收缩 法 ,第 三 章 545 的 
分 析 证 明了 计算 的 4 与 (4 十 Fi) 准确 相似 ,其 中 
LE rds < lm + ab + 十 lsh 

+ 2(r — DU+ zx) lAlz, (28.1) 
这 里 + 一 (12.36)2"', 而 9 是 第 i 步 的 剩余 向 量 。 因 此 ,只 要 我 
们 迭代 到 剩余 为 小 旱 , 即 使 接受 的 特征 向 量 不 好 ,也 能 保证 特征 值 
好 (在 它们 是 良 态 情况 下 ). 

局 然 ，44 的 对 称 性 不 变 。 在 分 析 上 的 一 个 明显 的 困难 来 自 
(4 一 90D 一 般 不 是 对 称 的 ，w? 是 其 准确 特征 向 量 ， 可 是 ,如 果 
我 们 取 1 是 对 应 于 «的 Raylsigh 商 ( 第 三 章 $54), 我 们 有 9 一 
9， 因此 


(A1 一 3 一 的 Du 一 hy, 《28.2) 
在 括号 中 的 矩阵 是 准确 对 称 的 . 
不 计 合 人 误差 ,我 们 知道 4, 的 各 个 特征 值 的 条 件数 在 西 收 缩 
下 是 不 变 的 。 但 是 ,这 有 一 点 误解 ,在 每 一 步 中 我 们 不 用 整个 矩阵 
Ai 运算 ,而 只 用 它 的 于 矩阵 B;, 这 里 


--|， (28.3) 
O | 8 
7 是 上 三 角 矩 阵 , 对 角 元 是 计算 的 特征 值 , 如 果 4 是 B 的 一 个 
特征 值 ， 容 易 证 明 鸡 关 于 B 的 条 件数 六 按 模 不 小 于 4 关于 4 
的 条 件数 x* 所 以 也 不 小 于 关于 4 的 ， 事 实 上 ,如 果 
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(28.4) 


那么 
Biv 一 Mr, BHw 一 Mw (28.5) 

这 说 明 1&| > la1。 因此 ，B 的 特征 值 一 般 地 没有 4 的 那样 
敏感 ,44 的 额外 增多 的 敏感 性 是 由 于 在 剩 下 的 三 个 子 和 矩阵 中 可 能 
有 概 动 ,虽然 在 ACE 上 的 实验 表明 通常 条 件数 逐步 改善 ,我 们 却 
没有 得 到 比 非 西 收缩 更 好 的 结果 。 

在 非 西 收缩 中 约 有 乘法 严 个 ,两 收 缩 要 4 个 , 而 如 果 和 4 是 
满 矩 阵 , 一 次 选 代 约 有 六 个 乘法 。 假如 求 每 个 特征 向 量 要 大 量 挝 
代 , 那 么 收缩 的 运算 量 只 占 总 运算 量 的 很 小 部 分 。 在 这 种 情况 下 ， 
我 们 有 充分 理由 使 用 无 条 件 地 保证 稳定 的 西 变换 , 


非 相 似 变 换 的 收缩 法 


29。 对 于 已 经 给 定 了 一 个 特征 向 量 x 的 情况 ，Wiclandt 
(1944b) 描 述 了 一 个 非 相 似 变 换 的 一 般 性 收缩 法 。 假定 aa 是 任 一 
个 使 得 下 式 成 立 的 向 量 


ur — hy {29.1) 
考虑 一 个 矩阵 4:, 其 定义 为 
A A— x 《29.2) 
我 们 有 
Am 一 4 一 一 《29.3) 


因此 ,x 仍然 是 一 个 特征 高 量 , 但 是 对 应 的 特征 值 变 为 零 ， 另 一 
方面 


(xz — ait) = Axi ~— oiAxi — wT 二 ori 
= ivi — Nu x 
一 Mi 一 (am 全 一 2 na). (29.4) 
因此 , 令 mw 一 (wfxi/ 0) ,我 们 看 出 , 略 仍 是 特征 值 ,所 对 应 的 特征 
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向 量 给 定 为 
一 和 一 (zx {29.5) 
注意 , ?个 向 量 #，xP(i 之 2) 是 独立 的 。 事实 上 ,如 果 


Ba tt DY Bix — Cfrf hr] 一 0， (29.6) 


因为 «是 独立 的 ,我 们 必定 有 Pi 一 0 (i 一 2, -…, #), 因此 名 也 
是 零 。 

Horclling 的 收缩 法 ($19) 是 这 个 方法 当 到 为 ay 的 特殊 
情况 ，? 是 在 特征 向 量 。 规 格 化 为 好 xm 一 1， 因 为 在 好 mw 一 和 
(i 关 0) 的 这 种 情况 下 特征 向 量 是 不 变 的 。 

30. 在 上 节 的 一 般 方 法 中 ， 我 们 已 假定 了 2 六 0， 虽 然 这 个 
条 件 可 以 用 原点 移动 来 保证 ， 但 是 这 是 方法 的 一 个 缺点 。 考 虑 矩 
降 
2 1 


4-| 
4 2 


]， 4 4 0, 


1 1 
a=| =- 人 [站 (30.1) 
一 个 适当 的 向 量 * 为 wT 一 [4，01。 并 且 我 们 有 
2 1 1 一 2 1 
4 | ,| 一 [;] [4 0 一 但; z|- (30.2) 
矩阵 4; 有 二 次 因 于 如, 它 比 4 病态 得 多 ， 
现在 假定 wm 是 某 一 个 满足 下 式 的 向 量 
vIn = 1, (30.3) 
我 们 有 林 4x 一 好 xx 一 2 并且 绽 4 可 以 作为 关系 (29.1) 中 
的 好。 用 这 个 向 量 Wiqand 的 方法 给 出 


A A— rwiA, {30.4) 
现在 特征 向 量 是 
xr — (wTAxif Mr x — (VTxe 
人 一 2 (30.5) 


并 且 1 的 值 是 零 不 再 具有 特殊 意义 。 可 以 直接 验证 js 一 (vIn) 
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全 一 2,.，…, 7) 的 确 是 4 的 特征 向 量 ， 这 显然 不 是 相似 变换 , 因 
为 一 般 地 是 改变 的 。 
如 果 规 格 化 ma 使 得 max(z) 一 1， 并 且 元 素 1 在 位 置 1 上 ， 
显然 4 的 选取 是 cw， 这 样 我 们 得 到 
A A— rethA. 《30.6) 
显然 , 4 的 第 1 行 是 零 ， 同 时 4 的 第 i 行 减 去 第 芋 行 的 忆 倍 得 
到 4 的 第 i 行 。 轩 此 ，Lw4shw 与 $ 22 收缩 法 得 到 的 矩阵 相 
比 ， 在 右 下 角 的 # 一 1 阶 矩 阵 中 元 素 想 同 ， 因 为 4 的 第 工行 为 
零 . 所 有 对 应 的 特征 向 量 (i 一 2,-…,n) 的 第 1 分 量 都 是 零 . 
从 另 一 角度 来 看 ， 这 也 是 明显 的 ， 因 为 4; 的 相应 的 特征 出 量 是 
三 一 (epxr)xt， 用 4 迭代 时 我 们 显然 可 以 政 去 第 1 列 和 第 1 行 ， 
只 用 (2 一 1) 阶 的 矩阵 
如 果 假 定 1 一 1, 以 后 的 讨论 就 简化 了 ， 当 工夫 1 时 ,只 须 作 
一 点 简单 的 修改 ， 于 是 收缩 矩阵 4; 给 定 为 
外 一 4 一 mef4 一 个 一心 c)4. (30.7) 
我 们 用 zs，x 久 ，x 各 ,+，x 表示 4 的 特征 向 量 , 其 中 x?(i 之 
2) 的 第 一 个 分 量 是 零 。 当 找到 x 名 之后， 我 们 可 以 执行 第 二 次 收 
缩 ， 并 且 又 假定 2 一 2 以 便 简 化 记号 。 因 此 我 们 有 
A= A eA (Tx) — ret)A, (30.8) 
并 且 4 的 第 1 行 , 第 2 行 全 是 零 。 
通常 以 显 式 形式 执行 收缩 法 是 方便 的 ,得 到 的 是 4 心 :……， 
或 者 至 少 是 在 后 面 选 代 使 用 的 各 个 = 一 1，# 一 2， 阶 的 相 
应 子 矩 阵 。 如 果 4 十 分 稀 朴 ,这 样 做 是 不 经 济 的 ,因为 4 及 其 后 
的 矩阵 一 般 不 再 是 这 样 稀 璇 了， 如 果 一 个 大 的 稀 酬 和 矩阵 只 需要 少 
数 几 个 特征 向 量 , 通 常 最 好 的 收缩 矩阵 是 (30.8) 的 因子 分 解 形 式 ， 
例如 用 公 迭代 ,我们 知道 ， 相 应 的 特征 向 量 的 头 两 个 分 量 都 是 
零 . 因此 ,我 们 可 以 取 初 始 向 量 wm 为 这 种 形式 、 并 且 4, 始终 保持 
这 种 形式 。 如 果 我 们 记 4z 一 Pr， 那么 我 们 先 计算 gr 其 定 
义 为 


qu To ep = pir — efpr)e, (30.9) 
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显然 ，gsm 是 从 pri 减 去 如 的 适当 倍数 消去 了 第 一 个 元 素 后 得 到 
的 ,然后 我 们 有 
(1 — ef)gs 一 Ya 一 (人 qz + = yon (比如 说 ). (30.10) 


因 


此 ，w+ 是 从 gsr 减 夫 浆 ' 的 信 数 消去 了 第 二 个 元 素 得 到 非 规 


格 化 向 量 。 当 我 们 有 4, 时 ， 这 个 方法 可 以 在 一 般 的 迭代 步 使 用 . 
例如 # 一 6,r 一 4, 我们 有 


并 且 4w, 必定 被 一 个 列 运算 


[zz ;x8] 一 


A = 


XXXXXX 


1 0 0 o 
x1 0 0 
xx1| _lo 
x x xj| ”| 
X X X x 
X X X x 

0 

0 
,vm | (30.11) 

x 

x 


i 不 是 行 运算 消去 过 程 简化 为 w+: 形 


式 ,向 量 "sx 然后 规格 化 为 ut 在 $ 34 中 我 们 将 看 到 这 几乎 就 是 
F. LIL， Bauer 提出 的 梯级 迭代 法 。 


用 不 变 子 空间 的 一 般 约 化 
31。 如 果 X 是 一 个 有 mm 列 的 不 变 子 空间 ,使 得 
AX ~— XM, (31.1) 
其 中 M 是 mx m 和 矩阵 ,又 如 果 了 是 x X 和 矩阵 ,使 得 
PITX 一 M. {31.2) 


那么 我 们 得 到 Wietandt 收缩 的 一 般 形 式 


* 原文 误 为 好 ,一 译 者 注 
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4 = A4—xP', (31.3) 
显然 
dX— AX— XPIR = XM — XM =0, (31.4) 
此 ,多 的 zw 个 独立 的 列 是 4; 的 对 应 于 零 特 征 值 的 全 部 特征 向 最 
(甚至 XX 对 应 一 个 mm 次 初等 因子 ,这 也 成 立 }。 另 外 ,正如 下 面 要 证 
明 的 4 的 其 余 特 征 值 与 4 的 相同 ,证 明 的 根据 是 一 个 简单 的 恒 等 
式 : 


det(1, — RS) = det(1» ~ SR). (31.5) 
当 和 5s 分别 是 任意 的 x xX?w 和 mm Xx 2 和 矩阵 时 , 它 都 成 立 。 由 RS 
的 非 零 特征 值 与 SR 的 非 零 特征 值 相同 (第 一 章 $51) 立即 可 得 到 
《31.5)。 从 (31.1) 我 们 进一步 看 出 


IX— AX—1X— XM, (31.6) 
给 出 
或 者 GA — ANX ~ X21, — M) 
Xl 一 MD) = (1, — A)'X. (31.7) 
现在 我 们 有 


det(41, — As) = det(11, — A + XPT) 
= det(21s — A)det{ ls + (21, — A) 'XPT] 
一 det(h1, — A)det[1, 


+ XU, — M)-'Pr] 从 (31.7) 
= det{41, 一 AYdet[ i» 

十 PIX(2Tw 一 MD) 碎 (31.5) 
~ det(h1s — A)det[ 1 

+ M(t — MY):] 从 (31.2) 


一 det(17。 — Armdet(An 一 M)- (31.8) 
这 表明 除了 属于 M 的 特征 值 用 零 代替 之 外 ，4， 有 4 的 其 余 的 特 
征 值 。 
32. Householder (1961) 讨论 了 4， 和 4 的 不 变 子 空间 的 关 
系 ,这 是 方程 (29.5) 的 推广 ,并 且 它 们 也 存在 与 该 式 中 出 现 除数 全 
想 类 似 的 缺陷 。 现在 我 们 只 沽 虑 实际 使 用 的 情况 ,此 时 比较 容易 
得 到 比 一 般 情况 稍 好 的 结果 。 
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作为 《30.3) 的 自然 推广 , 设 2 是 使 得 


07X 一 1 (32.1) 
的 矩阵 ,那么 由 (31.1) 我 们 得 
QAX ~ OXM = M, (32.2) 


因此 074 是 等 式 在 (32.2) 中 一 个 适当 的 逢 阵 PT。 于 是 在 这 个 情 
况 下 我 们 有 

hi A— XA (I XO0N)A, AX~0. (323) 
现在 假定 组 成 了 的 个 向 量 与 X 的 无 关 ,但 是 它 使 得 


AY — [XiY] 


3 
| = [XiY]w (32.4} 
N 


(注意 ,Y 不必 是 4 的 一 个 不 变 子 空间 ,但 是 (31.1) 和 (32.4) 表明 
[XiY] 是 不 变 子 空间 .) 现 在 沽 虑 4.(Y 一 XZ), 其 中 2Z 是 任何 使 
得 (Y 一 XZ) 存 在 的 矩阵 , 因为 4X 一 0， 我 们 有 
AlY — XZ) = AY = AY ~ XOTAY 

一 [Ri — XQTLX:YIW 

= [XiY]W — [XIXOT™Y]W 

=(Y— XYN. (32.5) 
如 果 我 们 取 Z 一 97Y， 等 式 (32.5) 表 明 了 一 X {87TY) 是 和 4 的 
一 个 不 变 子 空间 。 从 X 和 了 的 独立 性 立即 得 到 X 和 了 一 X(8rY) 
的 独立 性 ;如 果 我 们 汰 虑 一 个 特殊 的 应 用 ,这 个 结果 的 意义 就 更 明 
显 了 ,假定 4 有 一 个 四 次 的 初等 因子 (4 一 ,并 且 我 们 已 找到 
第 一 级 和 第 二 级 向 量 x 和 x, 但 是 未 找到 x 和 zx， 和 如果 我 们 收 
缩 它 ,那么 由 (31.4)， 撼 阵 4; 现在 有 相应 于 x 和 x 的 两 个 线性 
因子 4,2 和 一 个 二 次 因子 (4 一 4》， 这 因子 有 第 一 级 和 第 二 级 
的 向 量 ,分 别 对 应 于 收缩 后 的 x: 和 xz。 可 是 ,在 实际 上 , 用 4 选 代 
很 可 能 提供 由 ，xs，#，z 张 成 的 整个 空间 ,而 不 是 仅仅 由 x， 
如 张 成 的 子 空间 。 
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实际 应 用 


33. 对 和 矩阵 8 的 唯一 限制 是 它 应 满足 等 式 (32.1), 在 理论 上 这 
有 很 大 的 选择 自由 ， 但 实际 计算 中 ，8 的 选择 方法 是 使 计算 量 极 
小 。 如 果 我 们 记 87 一 [JiK] 和 XT 一 [UTiV7]。 其 中 J 和 U 是 
zw Xm 矩阵 ,那么 Q 的 可 能 的 最 简单 的 选择 是 


J=U", Kw 0. (33.1) 
如 果 记 
[5] 
4=|--— ~ ， 那 么 4; 一 |---- i 
DIE DIE 
v ic 
一 日 [zi0]| -一 一 -|， (33.2) 
了 DIE 
得 出 
0 ! 0 
中 一 | -~ 一 人- .| 《33.3) 
D—VUB!E— VU'C 


因此 入 的 第 1 行 到 第 w 个 是 零 。 黄 余 的 特征 什 是 CE 一 VU-C) 
的 那些 特征 信 . 

在 实际 上 ,我 们 不 会 取 X 的 前 外 行 ,而 是 用 主 元 方法 远 取 合适 
的 m 行 。 我 们 可 以 验证 这 样 做 的 结果 , 短 阵 (BE ~ VU-'C) ( 它 是 
二 的 一 部 分 ， 在 后 面 的 迭代 中 实际 使 用 的 ) 等 于 用 $ 23 的 方法 得 
到 的 收缩 矩阵 的 相应 部 分 。 

然而 ， 在 执行 收缩 之 前 把 不 变 了 空间 X 化 为 标准 的 梯形 是 比 
较 方 便 购 。 这 个 形式 是 由 执行 部 分 主 元 三 角 分 解 的 相应 部 分 得 到 
的 。 为 了 记号 方便 ,我 们 忽 路 这 主 元 ,我 们 可 写 

X=TR, (33.4) 


其 中 X,Y 和 的 形状 为 


xxx 
-| x | {33.5} 
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x 
x 
x 
x 
x 


XXXX X x 
XXX Xp 口 


0 
0 
1 
x 
x 
x 


XXXX x- 


i 
< x 
TT 是 x 单位 下 吉隆 ,是 mm 上 和 角形 乱 降 。 显然 ,如 
果 X 是 不 变 子 空间 ,那么 了 也 将 如 此 ， 因 此 , 自 起 至 终 可 用 工 代 竺 
X，。 因为 对 应 局 的 工 的 子 撼 阵 惕 在 是 m x m 单位 下 三 角形 抵 隆 ， 
所 以 《E 一 VU-'C) 的 计算 特别 简单 

如 果 4 是 稀 瑟 的 , 我 们 可 以 把 (33.2) 改 为 形式 ， 


(33.6) 


这 样 做 有 时 是 比较 经 济 的 . MC33.3) 我 们 入 的 相应 的 不 
于 空间 Y 的 前 王 行 是 零 .因此 ,如 果 用 4 迭代 ,我 们 可 以 从 具有 
这 种 形式 的 Y。 开始 ， 那 么 所 有 的 Y, 也 保持 这 个 形式 。 如 果 我 们 
写 


4AY, = |]， (33.7) 


那么 从 4Y, 减 去 了 的 这 列 的 倍数 消去 了 前 严 行 就 得 到 4;Y,， 因 
为 是 单位 梯形 矩阵 ,运算 特别 容易 、 


梯级 迭代 


34. 使 用 交代 和 收缩 方法 的 一 个 困难 ， 是 在 每 个 阶段 我 们 通 
常 不 知道 当前 的 主导 特征 值 是 实 的 还 是 复 的 ， 其 对 应 的 初等 因子 
究竟 是 不 是 非 线性 的 。 我 们 用 ”个 向 量 的 完备 组 同时 运算 能 克服 
这 个 困难 。 取 单位 下 三 角形 矩阵 的 列 作为 这 = 个 向 量 可 以 保证 其 
独立 性 ， 如 果 在 每 个 阶段 我 们 用 忆 表示 = 个 向 量 形 成 的 矩阵 ,这 
个 过 程 变 成 


Xu = ALss Ki LnRn, (34.1) 
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其 中 每 个 上 ,是 单位 下 三 角形 类 降 ,并 且 每 一 个 R, 是 上 三 角形 矩 
阵 . 如 果 令 L, 为 [， 那么 我 们 有 


LiRs= Xi ALots {34.2) 
RiR 一 ALaRs a = AdLia— A (343) 
LARRi RY) = AL A (34.4) 


因此 ,上 ,和 RRi.……R 是 4 的 三 角 分 解 得 到 的 矩阵 。 从 第 八 
章 $4 中 知道 , 上 , 等 于 工 R 算法 中 得 到 的 前 * 个 下 三 角 抵 阵 的 乘 
积 ,而 R, 等 于 同一 算 靶 中 相应 的 上 三 角形 矩阵 ， 因 此 ， 我 们 知道 
(第 八 章 56), 如 果 所 有 特征 值 不 等 模 ,那么 ,> 上 ,这 个 矩阵 是 
从 4 的 右 特 征 向 量 矩阵 的 三 角 分 解 得 到 的 。 不 要 以 为 这 方法 与 
LR 方法 形式 上 类 似 , 就 意味 着 它 也 会 像 LR 算法 在 实际 计算 中 
那样 有 用 。 

实用 的 LR 方法 的 成 功 依赖 于 许多 因素 ， 其 中 上 Hesenberg 
型 的 不 变性 (甚至 使 用 变换 )、 原 点 移动 的 有 效 性 和 收缩 过 程 的 稳 
定性 是 最 重要 的 .在 梯级 选 代 中 ， 如 果 取 4 是 上 Hesenberg 型 ， 
取 IL 是 1, 那么 虽然 上 仅仅 有 (n 一 1) 个 非 零 的 次 对 角 元 ,但 非 
霍 元 案 的 数目 在 各 个 Li 中 逐渐 弄 长 直到 工 。-,。 我们 得 到 一 个 满 
的 下 三 角 矩 阵 ,从 此 开始 4 是 满 矩 阵 了 , 

另 一 方面 ， 如 果 取 4 是 下 Hessenberg 型 ， 那 么 在 每 一 阶段 
ALi 也 是 下 Hessenberg 型 ,但 是 , 虽然 在 4Li 的 三 角 分 解 中 只 


有 二 由 个 乘法 ,然而 计算 4L1 需 要 小江 个 乘法 在 4Li 的 分 


解 中 , 行 的 交换 破 环 Hessenberg 型 ,但 列 交 换 却 不 破坏 Hessenberg 
型 。 然 而 和 LR 算法 一 样 , 引 人 交 换 就 破 环 了 方法 的 理论 根据 ,用 
(4 一 P1) 代替 4 来 运算 可 以 达到 加 速 收 合 的 目的 ， 同 时 ?可 以 
在 选 代 中 改变 ,但 由 于 还 缺少 一 个 真正 有 效 的 收缩 方法 , 因而 这 方 
法 远 不 如 工 R。 当 我 们 确定 4 的 一 个 小 特征 值 2 时 , 我 们 不 能 自 
由 选择 ,因为 这 可 能 使 (4 一 了 ) 成 为 4 的 一 个 主导 特征 值 。 

显然 ,我 们 不 必 使 用 全 部 ”个 向 量 组 ,我 们 可 以 用 单位 下 宰 形 
形成 的 亚 个 向 量 来 运算 。 用 T, 表示 这 普 个 向 最, 过 程 变 为 
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LT 一 Xe (34.5) 
其 中 Rs 是 wm Xm 上 三 角形 矩阵 。 如 果 4 的 力 个 主导 特征 值 的 
模 不 等 , 则 了 ,一 了 , 这 里 工 是 由 mw 个 主导 特征 向 量 的 梯形 分 解 得 
到 的 矩阵 。 更 一 般 地 ,如 果 
ul 1 rl > [mrs (34.6) 
那么 T, 不 一 定 趋向 于 一 个 极限 ， 但 是 它 趋向 计 一 个 不 变 子 空间 
(第 八 章 5 $32，34)。 这 个 方法 是 F. ILL、Bauer(1957) 首先 提出 来 
的 ， 称 为 梯级 选 代 或 者 阶梯 污 代 。 
如 果 [4i > 14|，T, 的 第 一 列 在 少量 迭代 之 后 就 收敛 于 = 
这 时 我 们 计算 x+r 时 ;在 7, 中 包括 x 是 没什么 作用 的 ， 一 般 如 
果 盖 的 前 尺 个 向 量 已 经 收敛 ,以 后 各 步 中 我 们 不 必用 4 乘 这 些 向 
量 , 我 们 可 以 写 


T, = [TT?], (34.7) 
其 中 7 多 由 前 和 个 向 量 组 成 。 这 些 向 量 都 已 收敛 ， 而 剩 下 的 未 收 
全 的 (m 一 和 个 向 量 组 成 TH。 现在 我 们 用 关系 
Ki = [TOIEATH] (34.8) 
定义 Xm， 其 中 了 ?已 经 是 梯形 的 , 但 是 4T 一 般 由 《mm 一 入 
个 满 向 量 组 成 。 然后 ,把 X, 直接 化 为 梯形 和 矩阵， 我 们 立刻 知道 
这 个 方法 与 530 讨论 的 相同 。 
应 该 关 重 指出 ， 不 一 定 前 面 的 列 先 收 伊 ;例如 ,如 果 4 的 四 个 
主导 特征 值 是 1,0.99, 10”, 10…, 前 两 烈 很 快 张 成 对 应 于 和 尼 
的 子 空 间 ,六 此 第 3,4 列 先 收敛 ,第 1,2 列 分 离 为 适当 的 特征 向 量 
则 比较 慢 , 如 果 主 有 导 特 征 值 对 应 非 线性 初等 因子 , 这 个 现象 会 更 明 
显 ， 我们 在 $41 给 出 数值 例子 。 


复 共 印 特征 值 的 精度 确定 

35. 前 儿 节 的 讨论 提出 一 个 确定 实 矩 阵 4 的 复兴 斩 特 征 值 的 
方法 。 当 特征 值 虚 部 小 时 , 它 也 不 会 遭受 任何 精度 的 损失 , (当然 
4 接近 一 个 有 二 次 初等 因子 的 矩阵 的 情况 除外 .) 我们 先 描述 不 
选 主 元 的 过 程 ， 在 每 一 步 我 们 用 一 对 实 向 量 w 和 bb 迭代 ,这 对 向 
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最 是 标准 梯形 形式 的 , 尖 
一 人 ao XXXx)， 


(35.1) 
好 一 (0，1 xX, XX, XxX). 
我 们 计算 cvs 和 erry 
cm = Aas, dri = Ab,, (35.2) 
并 写 
ch = (pins TH Xs XX ), (35.3) 


do (GewEm Xs, XX ), 
约 化 《ems dn) 为 标准 梯形 ,我 们 得 到 下 一 对 向 量 wu bo 
如 果 4 的 主导 特征 人 是 一 对 复 共 亏 数 ( 电 土 jr'), 那么 最 终 
[Lenmidin] = [Laib]M,, 《35.4》 
其 中 M, 是 2X2 矩阵 ， 它 随 著 而 改变 ， 但 是 有 固定 的 特征 什 
(全 士 各 )。 在 每 一 步 我 们 决定 矩阵 M,。 使 得 
1 9 Buts Bon 
lt 055 
并 且 从 M, 的 特征 值得 到 已 二 种 的 新 近似 信 。 
可 以 设想 ,如 果 人 小 ,我 们 计算 M 的 特征 值 时 仍然 会 损失 精 
度 ; 但 是 如 果 (和 二 jm) 是 4 的 情态 特征 值 , 这 种 损失 不 会 产生 。 
在 这 种 情况 下 。 我 们 会 发 现 ，mt? 和 nm 多 很 接近 所 。 并 且 mw 旬 和 
m 续 是 小 量 。 事实 上 , 在 丈 趋向 于 零 的 极限 情况 , 假 铸 了 没有 二 
次 因 于 (2 一 如)?，m 欠 和 mg 都 变 为 零 ， 最 后 向 量 o， 和 6 或 是 
cn 和 ni 较 精确 地 决定 一 个 不 变 子 空间 ， 但 是 在 $14 中 我 们 巴 
经 看 出 ， 决 定 两 个 独立 的 特征 向 量 十 一 个 病态 的 亲 题 。 如 果 M， 
的 对 应 于 所 十 a 的 特征 向 量 为 
三 一 (Pd)， (35.6) 
那么 4 的 对 应 的 特征 疝 量 就 是 (gre; 十 wm 如)， 自然 , 应 沪 规 格 
化 使 得 较 大 的 1p, 或 | 加 | 是 1 
为 了 数 信 称 定 。 在 约 化 [cidi+4] 为 梯级 形 的 过 程 中 泌 主 元 
是 必 不 可 少 的 ， ww 和 如 中 单位 元 素 通常 不 在 前 两 个 位 置 ， 何 况 
这 位 置 要 随 * 变 , 但 是 应 注意 ,决定 矩阵 M, 的 是 c++ 和 dos} 的 四 
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个 骑 ,它们 处于 与 ,如 中 单位 元 案 的 相同 的 位 要 


这 个 方法 包含 的 计算 量 是 $ 12 的 两 倍 , 在 那里 我 们 先 从 一 个 
迭代 向 量 序列 去 决定 (& 土 im)。 


十 分 车 近 的 特征 值 


36. 一 个 非常 类 似 的 方法 可 用 来 很 精确 地 决定 一 组 良 态 的 但 
是 不 明显 分 离 的 主导 特征 值 ， 例 如 。 假 定 实 矩 隆 4 有 主导 特征 值 
2 人 一 so 2 一 sa 8 是 小 量 ,如 果 我 们 用 一 组 梯形 的 催 量 a 
2 和 迭代 ,并 且 记 
[anicmihnl 一 Alaibics], (36.1) 
那么 像 在 $35 中 那样 处 理 ,我 们 可 以 从 as 5 cs 和 dspss csts frr 
的 适当 的 元 素 决定 一 个 3X3 矩阵 M,， 这 矩阵 M, 的 特征 值 将 分 
别 趋 向 于 jz 一 sa，4 一 62。 如果 4 的 特征 值 不 是 并 态 的 , M。 
的 特征 值 将 很 精确 地 确定 。 事实 上 ,最 后 M 的 对 角 元 素 接近 2， 
并 且 所 有 非 对 角 元 素 与 & 的 量 级 相同 。 


正 交 化 方法 


37. 现在 我 们 转 到 另 一 个 抑制 主导 特征 向 量 (或 者 特征 向 量 ) 
的 方法 。 最 简单 的 使 用 例子 是 对 实 对 称 矩 阵 。 假定 丸和 已 经 
决定 ,于 是 4 一 az。 我 们 知道 , 镜 下 的 特征 向 量 与 w4 正 交 , 因 
此 使 向 量 与 % 正 交 可 以 抑制 该 向 量 中 的 成 分 。 这 就 给 出 了 如 
下 定义 的 迭代 过 程 

Ve AWy wt = itr — (vs Fr}, 
Wt wit/ max( weri), {37.1) 

这 里 假定 了 zx 一 1， 显 然 ，w 趋向 于 次 主导 特征 向 量 , 如 果 4 
的 第 二 个 特征 值 也 等 于 4， 那 么 它 趋向 于 对 应 县 与 和正 交 的 
特征 向 量 . 

显然 ,除了 44| 六 1%| 以 外 ， 不 一 定 要 每 一 次 迭代 都 施行 与 
轿 正 交 化 ,而 且 当 4 是 高 阶 时 , 正 交 化 所 占 的 工作 量 是 微小 的 . 

我 们 可 以 把 这 个 方法 推广 到 已 知 的 ，z，-…， 为 求 mx 的 
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过 程 。 相 应 的 选 代 过 程 定义 为 
om ha wt tn Doh) 
? 


Wt = wir max( wn). (37.2) 
由 (37.1) 我 们 得 
一 《ri — ru Axs) 
= Au — bru xr) 
= Au, — LxlxTu) 
一 《4 — hrl)u, (37.3) 
因此 ,不 计 舍 人 误差 ,这 个 方法 给 出 的 结果 与 Hotelling($ 19) 的 相 
局 。 
关于 非 对 称 矩 阵 也 有 类 似 的 方法 ， 但 是 需要 计算 左 特征 向 量 
九 和 右 特征 向 量 %。 如 果 规 格 化 使 得 x 一 1， 我 们 可 以 用 下 述 
迭代 过 程 : 
Yn A xi 
Wt = Wstif Max( wt) (37.4) 
为 左 \ 右 特征 向 量 是 双 正 交 的 , wts 中 x 的 成 分 被 抑制 ， 显 然 ， 
我 们 也 可 以 推广 到 * 个 特征 向 基 已 经 决定 的 情况 。 


正 交 化 的 梯级 迁 代 


38. 在 梯级 挝 代 中 , 我 们 用 几 个 向 量 则 时 迭代 ,而 在 每 一 步 把 
它们 约 化 为 标准 的 梯形 ， 它 们 的 独立 性 被 保持 了 。 有 一 个 类 似 的 
方法 是 用 Schmidt 正 交 化 方法 (第 四 章 $54) 或 它 的 等 价 方法 保 
持 向 量 的 独立 性 ， 我 们 首先 考虑 ,用 * 个 向 量 同 时 迭代 的 情况 .如 
果 用 2, 表示 在 每 一 步 由 这 些 向 量 形 成 的 矩阵 , 那么 过 程 变 为 


8 一 Pr Vin™— QinRin, (38.1) 
其 中 8,+ 的 列 正 交 ,Rett 是 上 三 角形 矩阵 。 因 此 
48, 一 QinRin, (38.2) 
又 当 我 们 取 8。 一 三 时 ,我 们 有 
人 一 (CRR RD。 (33.3) 
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(38.3) 式 表明 ，90, 和 《R,R…R) 是 作 正 交 三 角 化 得 到 的 抵 
阵 ,与 CR 算法 (第 八 章 528) 作 比 较 表明 ，0, 等 于 QR 算法 决定 
的 前 :个 正 交 矩阵 的 乘积 。 因 此 , 如 果 1%| 全 不 相等 ，9， 本 质 上 
趋向 于 一 个 祖 限 ,这 是 特征 向 量 和 矩阵 尺 的 正 交 三 角 化 得 到 的 抱 阵 ， 
RR。 的 对 角 元 素 趋 向 于 11。 在 更 一 般 的 情况 下 ,有 某 些 特征 值 模 
相等 ，9, 的 对 应 的 列 可 能 不 趋向 于 一 个 极限 ,但 是 它们 最 后 张 成 
一 个 适当 的 子 空间 。 像 $34 那样 ,我 们 告戒 读者 ,这 一 节 的 方法 形 
式 上 与 2R 算法 等 价 ,并 不 意味 着 它 导 致 同等 有 效 的 实际 方法 。 

上 Hessenberg 型 的 不 变性 和 自动 的 和 稳定 的 收缩 方法 是 
QR 算法 成 功 的 实质 性 因素 ， 在 这 个 正 交 化 方法 中 没有 任何 类 
似 的 方便 的 东西 . 《比较 在 $ 34 末 对 梯级 选 代 的 相应 的 讨论 ,) 

39. 我 们 可 以 用 Householder 方法 进行 正 交 化 (第 四 章 $ 46)， 
这 时 我 们 在 每 一 步 得 到 转 置 07 而 不 是 9, 本身 .2, 是 (= 一 了 个 
初等 Hermite 拭 阵 的 乘积 PP RM， 用 这 些 术语 ， 这 方法 
变 为 

MP Pr Rep (39.1) 

如 果 全 部 |%| 不 相同 , |R,| 的 对 角 线 元 素 收 敛 , 并 且 在 这 个 阶段 
我 们 可 以 从 PP 计算 当前 的 8.， 在 较 早 的 阶段 不 必 计算 0,。 当 
有 些 12| 相等 时 ，|R,| 的 对 应 元 案 可 能 不 收敛 ， 并 且 不 可 能 分 辨 
在 9, 的 一 些 列 张 成 适当 的 子 空间 这 一 意义 下 的 极限 何 时 达到 。 

我 们 已 经 描述 了 9, 是 ” 列 的 情况 , 那 是 为 了 着 重 说 明 方法 与 
QR 算法 的 关系 。 事 实 上 ,没有 理由 说 明 , 我 们 不 能 用 较 少 的 列 来 
运算 如果 9, 有 * 列 ,这 方法 仍然 用 方程 (37.1) 来 表示 。 但 是 。 
现在 R, 是 * Xr 的 上 三 角形 第 阵 , 一 个 特别 有 意义 的 情况 是 + 一 
2, 主导 特征 值 是 复 共 斩 对 〈E: 土 种 ) 的 情况 , 这 时 8。 的 列 最 后 的 
是 两 个 正 交 向 量 ， 它 们 张 成 有 关 的 子 空 间 。 邑 使 小 小， 这 个 方法 
也 可 用 于 较 精确 地 决定 (8, 十 科 )》 和 不 变 子 空间 。 在 每 一 步 我 们 
可 以 写 


Van ™ QM, (39.2) 
其 中 MM, 是 2X2 矩阵 ,从 8: 的 列 的 正 交 性 有 
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M 一 QFV i (39.3) 
M， 的 特征 值 趋向 于 (&, 土 jm.)， 并 且 当 加 小 而 特征 值 是 良 态 的 、 
我 们 会 发 现 m 铭 和 "对 是 数量 级 ,因此 ( 瑟 土 jn.) 被 较 精确 地 
决定 。 


双 先 代 
49. Bauer 1958) 曾 提 出 $36 方法 的 一 个 推广 , 称 为 取 疾 代 . 
在 这 方法 中 可 以 同时 找到 全 部 x 和 y%。 在 每 一 步 中 都 保持 两 组 


+ 个 向 量 ,它们 分 别 移 成 矩阵 X, 和 Y,， 的 列 。 两 个 矩阵 Pi 和 
9 以 定义 为 


PH 一 4X Qn = ATY,, (40.1) 
并 从 它们 导出 两 个 矩阵 Xs 和 Yesa。 这 两 个 矩阵 的 列 被 选取 成 
双 正 交 的 ,决定 Xs， 和 Ya 的 第 列 的 关系 式 是 


rH BD ~ paf td — par pf, 
WH = gD iD a tN, 
(40.2) 
这 里 选择 ru，wr。 使 得 
a 0 xl) 一 和 
(Rl, C1) (40.3) 
显然 ,我 们 有 
Pu XmBRen, Qn = YanUn, (40.4) 


其 中 Ra Den 是 由 ru 和 wwi 形成 的 单位 上 三 角形 矩阵， 由 
双 正 交 性 我 们 得 
YX = Dn (40.5) 
其 中 Dw 是 对 角形 短 阵 ,如 果 我 们 取 X, 一 Y, 一 1， 我们 有 
A RXR, AX, = KiRsns (40.6) 
AT= Yt, ATY: = YUm, 


A RR RR (AY = YU UD. (40.7) 


一 《YU UU ITKR, RR 
=— (VIVE UPDD (Ri RR), 《40.8) 
这 表明 单位 下 三 角形 矩阵 5T0 了 于 DT 是 对 应 于 A” 的 三 第 分 解 
的 下 三 角 和 矩阵 。 我 们 已 经 看 到 ,在 LR 算法 中 Li Z2 是 人 
的 三 角 分 解 得 到 的 矩阵 (第 八 章 , $ 4), 因 此 
UF = Lyiby, {40.9) 
所 以 ，LR 算法 的 结果 立刻 转 到 了 双 和 迭代 ， 特别 是 如 果 |41 
不 同 ，UTU7.…U?Y 趋向 于 和 的 三 角 分 解 给 出 的 矩阵 ,因此 U, 一 
1。 类 似 地 ，R, 一 7。 实际 上 ， 通 常 在 每 一 步 X 和 Y 的 列 规格 化 
使 得 max(zp) 一 max(y 耻 ) 一 1。 因此 ， 在 1%1 不 同 的 情况 下 ， 
和 一 大 和 ,一 了 Y。 双 迭代 一 步 的 效果 等 于 LR 的 两 步 ， 当 有 
某 些 12f 相等 ，X。 和 Y, 的 对 应 的 列 趋向 于 相应 的 不 变 子 空间 。 
如 果 4 是 对 称 的 ， 这 两 个 X, 和 Y, 恒 等 。 这 个 方法 本 质 上 变 成 了 
$ 37 的 方法 。 因 为 在 每 一 步 , X, 的 列 本 身 是 正 交 的 。 这 一 事实 相 
当 于 对 称 矩 阵 的 LR 算法 的 两 步 等 价 于 8R 算法 的 一 步 。 
为 了 显示 方法 与 LR 和 QR 算法 的 关系 , 我 们 已 经 考 虞 X， 
和 Y, 是 = 个 向 量 的 情况 ， 但 是 这 个 方法 显然 可 以 用 在 X, 和 Y， 
列 数 " 从 1 到 # 的 情况 ,使 用 的 关系 式 也 相同 ,只 是 此 时 R, 和 U。 
是 > Xr 短 阵 .通常 这 个 方法 提供 ?个 主导 左 特征 向 量 和 右 特征 
向 量 ( 或 者 不 变 子 空间 )。 


数值 例子 


41. 为 了 提醒 我 们 注意 在 使 用 上 一 节 的 方法 中 发 生 的 问题 ,这 
时 给 出 一 个 简单 的 数值 例子 .在 表 2 中 显示 梯级 迭代 ($34) 和 $38 
的 正 交 化 方法 的 应 用 。 了 4 为 3x3 和 矩阵 ,其 初等 因子 是 (4 十 1 
和 (1 十 0.1)， 

在 梯级 迭代 的 应 用 中 ,三 角 化 过 程 用 了 主 元 ,每 一 步 的 主 元 位 
置 保持 固定 .在 4 的 特征 值 是 实 的 情况 下 ， 除 了 开始 几 步 可 能 变 
化 之 外 ,这 不 变性 是 确定 的 . 注意 。Z, 的 第 二 列 很 决 趋向 于 极限 . 
这 个 极限 向 量 的 第 一 个 分 量 是 零 ， 并 且 向 量 落 在 对 应 于 二 次 因子 
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家 2 


4 
一 2.1 一 1.3 . 一 0.1] 和 :一 一 1 初等 因子 (和 士 1)? (十 0.1) 
| 1 0 0 | 一 一 0.1 
0 1 0 
bi A *y py 3 ys 
1 -2 0.01 1.0 1 1 
-1 1 0.l 11 O01 2 
1 0 1 0.1 0 1 
x 和 x 形成 4 的 一 个 不 变 子 空间 ， zx: 是 特征 向 量 . 
y 和 ys 形成 47 的 一 个 不 变 于 空间，y 是 一 个 特征 向 量 . 
梯级 选 代 
Al 所 RR, 


2 一 1.2 一 0 1 : -TT-2 一 1.2 一 0.1 
1 0 0 |r|~0.475 一 0.571 1 - - 一 0.048 
0 1 0 0 1 - - 1 0 


注意 主 元 行 分 别 在 位 置 1， 3。2 并 保持 这 位 置 


4 
一 1.529 0.585 一 1.200 
| 1.000 0 0 ~ 
0.476 一 0.571 1.000 
R: 
“ 一 1.529 0.585 一 1.200 
| | - | 
: -0753 1.373 
AL, 
一 4346 0.5 一 1.200 
| 1.000 0 0 上 
一 0.654 一 0.509 1.000 
了 Ra 
1 “ : 一 1.346 0.5I1 ~—1.200 
| 一 0.502 | | = | 
0.486 1 - 一 0.757 1.583 
4 
一 1.257 0.502 一 1.200 
| 1.000 0 0 上 
一 0.743 一 0.502 4.000 
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续 表 2 


Lt R, 
1 > 一 14257 0.502 —1,200 
上 一 0.500 | 叶 " | 
Qo591 1 - : 一 0.799 1.709 
正 交 化 方法 
A 
2 2 ol 
| 1 0 o 上 
0 1 o 
9, RB 


一 0903 一 0.196 一 0.395 2.326 1.084 0.090 

| 0.430 一 0.414 ow | | . 1.125 oo 

0 一 0.889 一 0,474 “ .038 
42， 


1.380 0.820 1.824 
一 0.903 一 0.196 一 0.395 |_ 


0.430 一 0.414 一 0.789 
Os RB 


0.810 0.425 0.402 1.704 0.664 1.488) 
一 0.530 0.235 0.816 0.664 | 


0,252 一 0.875 0.425 - D 0.087 
49， 
一 1090 —i.087 ~—1.866 
| 0.810 0.425 wo |- 
一 0.530 0.235 0.816 1 
0 Ry 
—0.748 一 0.523 一 0.439 1.458 0.964 1.322 
| 0.556 —0.159 -oe | | 0.700 :| 
一 0.364 0.837 一 0.388 | 。 0.098 
42， 
0.940 1.205 1.928 
[es 一 0.523 一 0.439 | 


0.556 —0.159 一 0.806 


的 子 空 间 内 。 第 一 列 趋向 于 对 应 + 一 一 1 的 唯一 的 特征 向 量 , 但 
是 收敛 当然 是 慢 的 ($ 16)。、 因为 4 是 三 险 的 ， 主 元 的 位 置 一 旦 因 
定 , 最 后 一 列 就 吕 定 ， 但 是 "名 很 快 趋向 aa。 r 办 收敛 并 且 工 ,的 
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第 二 列 立 刻 趋 于 真 的 极限 ,而 第 一 列 却 未 收敛 ,这 一 事实 给 出 了 强 
烈 的 暗示 : 所 阵 有 一 个 非 线性 初等 因子 。 〈 假 妈 我 们 有 两 个 相等 
的 线性 初等 因子 的 话 ,两 列 都 应 趋 于 极限 ,而 如 果 有 复 共 施 特 征 值 
的 话 , 都 不 会 趋 于 极限 . ) 可 以 验证 的 第 一 列 和 第 二 列 形成 一 个 
不 变 子 空间 ,因为 4L; 的 前 二 列 和 工 ,的 前 二 列 几 乎 线性 相关 . 事 
实 上 ,由 最 小 二 先 法 我 们 有 

一 1.257 0.502 | 


1 0 
一 0.743 一 0.502 
0.486 1.000 


1.000 0 
一 0.743 一 0.502 


x 


一 1.257 0.502 ， 
[as 0 " 一 0.098 —2.972 
从 (41.1) 中 的 2x2 矩阵 求 出 特征 值 ,特征 方程 是 
入 十 2.0001 十 1.000215 一 0。 (41.2) 
但 是 决定 这 些 特征 值 当然 是 一 个 病态 的 问题 。 我 们 回想 $13 的 例 
子 ,情况 也 是 这 样 

现在 讨论 正 交 化 方法 。 我们 发 现 8; 的 第 三 列 趋 于 一 个 极限 ， 
这 是 与 对 应 二 次 因子 的 子 空间 正 交 的 向 量 ,这 个 向 量 应 该 是 6- 二， 
2.6- 二 6 二 J， 但 在 我 们 的 例子 中 它 不 像 人 们 预想 的 那样 准确 , 这 
是 因为 我 们 用 Schmidt 正 交 化 代替 初等 Hermite 正 交 化 。 在 这 
个 例子 中 ， 由 计算 正 交 于 前 两 列 的 (唯一 ) 向 量 容易 得 到 较 精 确 的 
第 三 列 ,前 两 列 中 没有 一 列 迅 速 趋 向 极 根 ,第 一 列 是 缓慢 地 趋向 于 
对 应 4 二 1 的 唯一 的 特征 向 县 ， 事 实 上 ,不 计 规 格 化 因 于 ，9; 的 
第 一 列 与 二 ,的 第 一 列 相同 ,第 二 列 周 祥 慢 地 趋 于 2 维 空间 中 与 上 
述 特征 向 量 正 交 的 向 量 ,元素 + 妨 很 快 趋 于 |%s| ,符号 可 以 从 8, 的 
第 三 列 每 一 次 近代 改变 一 次 符号 来 推断 ， 

我 们 没有 像 梯 级 迭代 中 那 祥 的 出 现 非 线 性 因子 的 明确 指示 ， 
但 是 第 三 个 向 量 的 收敛 福 表 明 , 其 它 两 个 向 量 已 张 成 2 维 空间 ,我 
们 从 2 和 49; 的 几乎 线性 相关 的 前 两 列 决定 对 应 的 特征 值 。 按 
照 最 小 二 乘法 ,我 们 有 


sb32. 


0 0 
一 0215 0 |. 010 


0.940 1.205 一 0748 一 0.523 
一 六 748 一 0.523 | 一 0.556 一 0.159 |x 


0.556 一 0.159 | | 一 0364 -0.837 
_1320 1134 一 0.290 一 0.441 

一 10 | 0230 一 1093 |, (413) 
0090 一 0683 0.190 一 0.105 


2X2 算 阵 的 特征 方程 是 
P+ 2.0034 十 1.003620 一 0。 {41.4) 
我 们 又 遇 到 一 个 确定 特征 值 的 病态 问题 。 

撼 阵 有 共 薄 特征 值 而 没有 非 线性 因子 时 ， 梯 级 迭代 有 一 个 令 
人 不 满 的 思 点 那 就 是 在 迭代 过 程 中 主 元 的 位 置 始 终 在 改变 , 按 模 
比 复 特征 值 小 的 实 特征 值 对 应 的 向 量 不 趋向 极限 ， 因 为 它 的 零 元 
素 不 是 在 辐 定 的 位 置 。 然 而 ,如 果 我 们 不 使 用 主 元 案 策 略 , 有 时 数 
值 会 严重 不 稳 。 正 交 化 方法 没有 这 个 弱点 。 

在 矩阵 有 非 线 狂 因子 的 情况 下 , 双 正 交 迭 代 是 比较 差 的 。 XX 
和 Y, 的 第 一 列 分 别 缓慢 地 趋 于 = 和 为， 而 这 两 个 向 量 是 正 交 的 
《第 一 章 47), 因 此 从 $ 40 的 re 和 wits 的 定义 ， 后 面 的 列 的 双 正 交 
化 过 程 变 得 愈 来 愈 数值 不 稳 了 。 


Richardson 改进 方法 


42，Ricbardson(1950) 提出 了 一 个 方法 ,在 已 知 特征 值 的 好 的 
近似 值 时 。 这 个 方法 可 以 用 来 计算 对 应 给 出 近似 值 的 特征 值 的 特 
征 向 量 。 其 结果 是 基于 下 述 考 察 。 假如 特征 值 已 准确 地 知道 ,并 
且 


Wo Fox (42.1) 
是 一 个 任意 的 向 量 ,那么 


I (4 — uD HH CG — ta, (42.2) 
Da E23 


所 有 其 它 成 分 都 被 消去 ， 因此 , 我 们 可 以 依次 得 到 每 一 个 特征 向 
最 ， 如 果 我 们 有 了 一 个 较 精 确 的 近似 值 ，%; , 而 不 是 准确 的 值 , 那 
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么 用 (4 一 1 了) 左 乘 便 可 极 快 地 淹 减 x 的 成 分 

虽然 这 似乎 是 一 个 十 分 有 力 的 工具 。 但 是 对 于 某 些 特征 值 分 
布 情况 ， 以 我 们 描述 的 方式 直接 使 用 它 ， 会 令 人 很 失望 。 沽 太一 
个 矩阵 ， 有 特征 值 4 一 1 (r 一 1, 2，…，20)。 我 们 要 决定 
zw%， 假 定 五 一 工 一 10 ~ 1fr(lr 一 2,……, 20), 并 且 可 以 
准确 地 执行 计算 ,如 果 用 Ha 一 妇 了 ) 左 彝 任意 向 量 w, 那么 除 


了 各 和 xw 之 外 , 所 有 成 分 都 被 消去 ,它们 分 别 变 为 


oo- 和- 友 


一 a10-0/19)n (42.3) 
各 
各 个 i+ 107") (6 一 DD) 3) 
… 估 一 二 x ~ on( 20) x, (42.4) 


a 的 成 分 相对 于 xw 的 成 分 来 说 实际 上 增 大 了 10' 倍 以 上 ， 假如 我 
们 用 《4 一 1) 执行 三 次 初始 迭代 且 计 算是 准确 地 执行 的 话 ; 那 
么 飞 的 成 分 会 削减 一 个 因子 10-*。 但 是 ， 合 人 误差 使 得 任何 成 
分 不 能 压缩 到 低 于 2 …m 太 多 。 当 已 知 比较 精确 的 特征 值 时 ,我 们 


常常 可 以 决定 一 个 整数 7 使 得 玉 《4 一 办 14 给 出 一 个 相当 精 
确 的 ws 但 是 通常 我 们 发 现 Richardson 方法 的 应 用 范围 有 点 令 人 
失望， 

矩阵 平方 法 


43, 我 们 可 以 直接 形成 矩阵 的 冬 塞 序列 代替 对 任意 和 形成 序 
列 Am, 其 优点 是 一 且 计 算 了 4', 只 要 一 次 类 阵线 法 就 得 到 4， 
因此 我 们 可 以 建立 序列 4, 人 ,4',…，4*， 并 且 有 


A EN { + DB fy} (43.1) 
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当 l21 丰 相册 时 ， 撼 降 的 者 由 项 好 ma 径 占 优 ,结果 所 有 行 变 得 平 
行 于 %。 所 有 列 平行 于 二， 收敛 速度 取决 于 《〈ij aa)” 趋向 于 零 的 
速度 .办 此 ， 即 使 ]a| 和 2 是 不 明显 分 离 的 。 也 仅 要 很 少 次 先 
代 


通常 ,逐次 的 矩阵 4* 的 元 素 很 快 增 大 或 老 很 锯 减 小 , 即使 用 
浮 点 运算 也 发 生 上 溢 或 下 滋 、 这 个 现象 可 以 通过 引信 2 的 者 作 比 
例 因 了 于， 平衡 每 一 个 矩阵 来 避免 。 需 次 的 选取 是 使 得 矩阵 元 素 的 
错 有 指数 为 零 。 这 样 作 不 会 引 和 人 附加 的 侈 人 误差 。 胃 矩阵 的 乘 方 
和 简单 的 军法 在 运算 精 误 范 转 内 涪 去 zy 的 成 分 所 需要 的 选 代 
次 数 ,分 别 取决 于 

af < 2 和 bf/al < 和 (43.2) 
如 果 4 的 零 元 素 不 太 多 ， 在 和 矩阵 平方 的 选 代 中 一 步 的 运算 量 约 是 
简单 的 方法 的 = 倍 ， 如 果 
tlog 2/ log | 42| > slogs{ slog2/ log |hf it}, (43.3) 
扼 阵 平方 法 比较 有 效 , 对 于 一 个 给 定 分 离 误 的 矩阵 ,和 充分 大 的 mn。 
矩阵 平方 总 是 不 利 的 。 肥 之 ,固定 #, 如 果 入 的 分 离 充 分 小 ， 
撼 降 的 平方 比较 有 效 ， 当 4 是 对 称 的 , 所 有 矩阵 的 短 也 对 称 。 所 
以 ,在 和 矩阵 平方 中 可 利用 对 称 性 ,但 是 篇 单 的 选 代 方 法 中 并 不 能 从 
对 称 性 取得 好 处 、 
例如 , 各 黑 [fh41 一 一 2 9， :一 40， 消 去 为 的 成 分 到 运 
算 精 度 需 要 矩阵 平方 法 的 15 步 或 者 篇 单方 法 的 28000 步 。 因 此 ， 
乞 阵 平方 法 对 于 2000 阶 以 下 更 有 效 ， 对 于 100 阶 和 矩阵 ,矩阵 平方 
法 的 效率 几乎 是 简单 方法 的 20 倍 . 
可 是 这 样 的 比较 有 一 点 使 人 误解 ,原因 有 了 两 点 : 
0》 我 们 不 太 可 能 执行 简单 方法 28000 步 而 不 应 用 某 种 加 速 
收敛 的 方法 ,但 是 炬 阵 平方 的 方法 中 加 速 技术 的 应 用 不 太 方 便 ; 
(it 实际 上 大 于 50 阶 的 绝 大 多 数 和 矩阵 都 是 十 分 稀 琉 的 , 通常 
撼 阵 平方 破坏 稀 醇 性 、 因 此 工 述 关于 两 个 方法 需要 的 工作 基 的 简 
单 估计 是 不 弓 合 实际 的 。 
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数值 稳定 性 . 


44. 就 主导 特征 值 和 主导 特征 向 最 来 说 ， 矩 阵 平方 法 是 一 个 
十 分 精确 的 方法 ,尤其 是 当 内 积 能 作 累 加 时 更 是 这 样 .如 果 有 多 于 
一 个 特征 向 量 对 应 于 模 数 大 的 一 个 或 几 个 特征 值 ， 考 察 一 下 会 发 
生 什 么 现象 是 有 意义 的 。 如 果 我 们 记 

A Lainte ta], WAA = A Lato: i 

(44.1) 
现在 每 一 个 向 量 wx 都 用 表示 ,因此 如 果 我 们 有 一 个 实 的 主导 特 
征 值 对 应 7 个 独立 的 特征 向 量 、 这 ”个 向 量 都 以 心 的 列 来 表示 。 
男 一 方面 ， 如 果 4 有 2% 和 一 加 作为 主导 特征 值 ， 最 终 4 的 每 一 
列 由 一 个 向 量 和 成 , 它 落 在 对 应 的 两 个 特征 向 量 张 成 的 子 空间 内 。 
在 任何 情况 下 取得 4 的 特征 值 的 最 好 方法 是 用 简单 矫 法 从 4” 的 
独立 的 列 向 量 得 到 . 

因为 随 着 4 的 堆 增 高 ， 形 成 特征 值 的 分 离 度 稳定 地 改善 ， 这 
样 看 来 矩阵 平方 与 简单 短 法 和 收缩 结合 起 来 对 我 们 是 有 甬 引 力 
的 .在 这 个 结合 的 方法 中 ,我 们 应 对 比较 适中 的 值 + 计算 4* 一 B， 
然后 对 B, 用 简单 筹 送 代 。 这 个 方法 的 弱点 是 模 比 较 小 的 特征 值 
比较 难以 用 B, 表示 ,事实 上 ,我 们 有 


Pao Dy + O27 (44.2) 
其 中 0(2"") 表示 会 人 误差 的 影响 ,如 果 [axl < 二 11, 坟 惟 那 


一 项 当 * ~ 6 有 时 已 经 小 于 会 人 误差 , 从 Bk 得 不 到 mx 和 入 的 任何 

有 效 数字 可是、 在 7 步 乱 阵 平方 之 后 结合 篇 单 的 选 代 来 寻找 主 

导 特征 值 是 最 经 济 的 方法 ， 在 若干 个 其 它 的 特征 值 接近 主导 特征 

值 的 情况 下 ,用 简单 交代 和 收缩 可 以 从 B. 十 分 精确 地 决定 这 些 特 

征 值 。 例 如 ,如 果 矩 阵 的 特征 值 以 递 碱 次 序 给 定 为 
1.00，0.99，0.98，0.50。…，0.00， 

那么 在 6 步 矩 隆平 方 后 。 所 有 特征 值 除 了 前 三 个 之 外 都 实际 上 消 
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去 了 ,这 三 个 分 别 变 为 1, (0.99)，(0.98 六 。 三 个 对 应 的 特征 向 
县 在 B, 中 得 到 充分 表达 ， 并 且 能 用 人 简单 迭代 和 收缩 相当 精确 地 
得 到 。 因 为 现在 它们 是 十 分 明显 地 分 离 的 ， 只 需要 少量 的 迭代 就 
能 得 到 好 结果 。 


Chebyshev 多 项 式 的 使 用 


45. 假定 我 们 知道 特征 值 2 到 4, 都 落 在 某 个 区 闻 (a,8) 内 ， 
而 aa 在 区 说 之 外 ， 为 了 构造 有 效 的 选 代 格式 , 我 们 希望 决定 一 个 
4 的 矩阵 函数 作 4)， 使 得 1f(44)| 与 11(4) | 在 区 间 (4,5) 上 的 极 
大 信和 的 比值 尽 可 能 的 大 ， 如 果 我 们 只 讨论 多 项 式 函 数 ， 那 么 
Chebyshev 多 项 式 就 是 这 个 问题 的 解 。 


时 变 痪 
x {2 (a+ 2 ~ a) (45.1) 

把 区 闻 (a, 5) 变 为 (一 1,1), 那么 = 次 多 项 式 

fh(2) 一 Te(r) 一 cos(ncos™!x) (45.2) 
满足 了 我 们 的 要 求 . 因此 , 如果 我 们 用 关系 式 

B=[24— (at oI — oa) {45.3) 
定义 8B, 最 有 效 的 :次 多 项 式 是 7,(8)， 因 为 Chebyshev 多 项 式 
满足 递 推 关 系 

TlB) 一 2BT(B) ~ Tl(B). (45.4) 


因此 ， 从 任意 向 量 ww 开始 。 我 们 可 以 由 下 述 关系 形成 应 量 w 一 
T(B)w, 一 1 2 、 
TB)vs = 2BT,(B)v — Tsk B)wo, (45.5) 


vin 一 28 — vise (45.6) 
每 一 次 选 代 只 要 一 次 乘法 计算 量 , 不 比 简单 选 代 的 多 .显然 ,对 应 
44 的 特征 向 量 可 以 用 类 似 的 方法 获得 。 


关于 用 正 交 多 项 式 计算 特征 向 量 有 大 量 的 文献 .这 种 方法 对 
于 计算 从 有 限 差分 玻 近 伪 微 分 方程 产生 的 大 稀 璇 矩 阵 的 小 特征 值 
有 着 广泛 的 应 用 。 一 般 说 来 ， 方 法 的 成 功 与 否 相当 关键 地 取决 于 
实际 过 程 的 具体 处 理 。 读 者 可 参阅 Sietd(1958] 和 Engdli(1959) 
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等 人 的 论文 。 


关于 直接 迭代 的 总 评述 


46. 我 们 已 经 讨论 了 用 4 本 身 或 者 (4 一 好 ] 的 迭代 方法 , 现 
在 我 们 来 评述 这 类 方法 。 所 有 这 类 方法 都 有 一 个 明显 的 缺点 。 这 
就 是 受 收敛 率 的 限制 。 它 们 的 主要 优点 是 简单 ， 并 且 如 果 不 作 显 
式 收 缩 ,就 可 以 充分 利用 矩阵 的 稀 醇 性 。 

我 发 现 它们 最 有 用 的 应 用 领域 ， 是 决定 大 的 稀 醇 甜 阵 的 少量 
代数 值 极 大 或 极 小 的 特征 值 和 对 应 的 特征 向 量 。 的 确 , 对 于 十 分 
大 的 稀 政 失 阵 ,通常 只 有 这 闫 方法 可 以 应 用 。 因为 涉及 约 化 矩阵 
为 压缩 型 的 方法 ,通常 都 会 破坏 稀 栈 性, 并且 花费 的 时 间 太 多 ， 邵 
果 怎 阵 是 稀疏 的 ,并 且 非 零 元 由 某 种 系统 的 方式 定义 ,常常 可 以 如 
和 免 纸 阵 全 部 元 素 存储 在 一 起 ， 而 只 要 在 每 次 选 代 过 程 中 产生 所 需 
要 的 元 素 ， 如 果 需 要 多 于 一 个 特征 向 量 ,我 们 可 以 像 $30 那样 ,不 
必 以 显 式 方式 执行 收编, 

使 用 若干 向 量 ( 或 者 = 个 完全 的 向 量 组 ) 的 方法 有 极 大 的 理论 
价值 ,因为 这 些 方 法 与 LR 和 8R 算法 有 密切 的 关系 。 实 际 上 , 虽 
然 在 知道 (或 者 猜测 ) 有 非 线性 初等 因子 的 情况 下 ， 这 些 方法 对 于 
计算 相应 的 不 变 子 空间 达到 合理 的 精度 是 有 用 的 。 但 是 值得 大 力 
推荐 使 用 它们 的 情况 似乎 不 太 多 。 

有 人 人 建议， 这 类 方法 应 该 用 于 改进 由 相似 变换 方法 得 到 的 有 
会 人 误差 的 特征 值 。 可 是 ,正如 我 们 已 经 指出 的 ,用 稳定 性 好 的 相 
似 变换 的 方法 是 极 好 的 。 但 直接 用 4 运算 ,方法 的 高 度 稳定 性 不 
象 我 们 设想 的 那样 好 。 我 们 将 在 854 中 讨论 的 方法 ,用 于 改进 完全 
的 特征 系统 比 梯级 迭代 和 有 关 的 方法 优越 得 多 . 尽管 如 此 , 我 的 
经 验 是 : 一 个 算法 的 微小 修改 ， 有 时 会 使 它 的 效果 十 分 显著 地 提 
高 ,梯级 选 代 \ 正 交 化 方法 和 有 双 闪 代 可 能 都 是 例证 ， 


赣 挝 代 
4 我 们 已 经 指 由 ，LR 和 2R 算法 实际 上 依赖 于 军法 ,但 是 
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似乎 有 点 奇 八 ,这 些 方法 能 达到 十 分 高 的 收敛 率 ,而 直接 的 时 法 的 
主要 弱点 却 是 收敛 慢 . 

在 使 用 的 原点 移动 ”收效 于 js 时 ,LR 和 QR 方法 的 收 合 速 
度 取 决 于 【[(4, 一 8)/(2s-1 一 p)]” 趋 向 于 零 的 速度 。 在 这 个 过 
程 中 ,选取 ?作为 1。 的 近似 值 。 如 果 我 们 用 (4 一 并) 而 不 是 
《4 一 好) 作 寡 法 ,我 们 能 得 到 类 似 的 高 收效 率 。 不 计 会 人 误差 
选 代 过 程 定义 为 

vn A pI, wn vnfmax(om), (47.1) 

如 果 我 们 写 


Wo = Dixi, 《47.2) 
不 计 规 格 化 因 于 ,我 们 有 
w= Fol — PY (47.3) 
因此 , 如 果 [4 一 P< 1 为 一 pi (Gi 在 刀 中 人 到 有 的 成 
分 随 着 增加 很 快 地 缩减 .我们 已 经 描述 过 这 个 方法 用 于 对 称 三 
对 角 和 矩阵 的 特征 向 量 计算 。 但 是 因为 它 有 重大 的 实际 意义 ,我 们 
现在 对 更 一 般 的 情况 作 进 一 步 分 析 。 


首 渤 代 的 误差 分 析 


48. 上 节 的 论述 表明 ,一 般 而 言 ,? 您 辕 近 lx 就 念 快 趋向 
4。 可是, 当 趋向 at， 矩阵 (4 一 1) 就 变 得 愈 来 念 病态 , 直到 
了 一 时 ， 它 变 成 奇异 的 ， 了 解 这 一 变化 对 迁 代 过 程 的 影响 是 
重要 的 . 
实际 上 ,矩阵 (4 一 好 ) 是 用 部 分 主 元 素 靶 ,分 解 为 三 角形 因 
子 的 乘积 LV， 并 存储 工 和 的 元 素 以 及 主 元 素 的 位 置 (第 四 章 
539)，。 这 表明 ,不 计 会 人 误差 有 
P(A~pI)= LLU, (48.1) 
其 中 了 是 某 个 置换 矩阵 ， 用 存储 的 信息 ， 我 们 通过 解 现 个 三 角形 
方程 组 


ZL7y 一 P 和 TUx 一 )?， (48.2) 
可 以 有 效 地 解 方 程 (4 一 p1)x 一 5。 除了 给 出 数值 稳定 性 之 外 。 
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交换 不 起 作用 。 例 人 误差 的 效果 是 使 我 们 得 到 


P(A4—pI+F)=LU0, (48.3) 
并 生计 算 的 * 满足 
P(A—pI+F+G) x= Pb 
或 者 《4 一 让 十 了 十 Goz 一 加 (48.4) 
其 中 和 Gs 是 依赖 于 伟人 误差 的 小 元 素 矩 阵 (第 四 章 $ 63)。 显 
然 ;矩阵 了 与 总 无 关 , 但 是 Ge 与 三 有 关 。 


两 此 ， 在 得 到 三 角 分 解 之 后 ， 我 们 可 以 接 下 述 定义 计算 序列 
EL 

(A~— pl+ FT GT ts wn vnllenl, (48.5) 
这 里 为 了 分 析 方 便 ,我 们 已 经 按 ?- 范 数 规格 化 w+。 假如 Gu 是 
零 的 话 ,那么 我 们 是 用 (4 一 p1 十 了 ) ”准确 地 氨 代 ， 因而 趋 
向 于 《4 十 F) 的 对 应 最 接近 了 于? 的 特征 值 的 特征 向 量 。 如 果 
TFI4i 小 , 除非 特征 向 量 是 病态 的 ， 这 计算 的 向 量 的 精度 是 高 
的 . 像 我 们 指出 的 那样 。 三 角形 方程 组 的 计算 解 通常 是 异常 的 精 
确 (第 四 章 8$61, 62)。 这 使 得 实际 上 在 每 一 步 w+ 通常 是 非常 接 
近 方 程 

(A~ pl + F)r—u, 

的 解 ,并 且 迭 代 向 量 最 终 的 确 收 化 于 (4 十 了 ) 的 特征 向 量 ，- 

49. 即使 不 利用 三 角形 符 阵 的 这 些 特殊 性 质 ， 我 们 也 能 证 
明 : 除了 xx 是 病态 的 雇 外 ,不 管 ? 的 值 多 么 靠近 4 或 者 实际 上 等 
于 它 , 逆 迭代 法 都 给 出 好 的 结果 。 我 们 写 


P=hte, FtG,™— H, MH,= e. {49,1) 
不 失 其 一 般 性 ,假定 4I 一 1, 因此 我 们 可 写 
(A4~— pl +t Hv tw, (49.2) 


现在 我 们 证 明 ， 为 了 建立 我 们 的 结果 ,只 要 证 明 w+: 是 大 的 就 够 
了 .由 (49.2) 我 们 得 
(4 — lelt Hv/flesd = ufonls, (49.3) 
《4 一 Du (sl ~ Hunt wefllvsills = 9 (49.4) 
其 中 
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ll < 《el 十 6) + Liefl, (49.5) 
这 证 明了 ,如 果 |lw.rall 大 ,并 且 se 和 sz 小 ,那么 wa 和 妈 导出 的 
刹 余 小 .因而 ws 是 一 个 好 的 特征 向 量 ， 除 非 x4 是 病态 的 。 事 实 
上 , 令 
全 一 Zaim Ven = DPis, (49.6) 
并 且 假 定 | 由 一 |yij; 一 1， 我们 用 并 左 乘 方程 《49.2) 的 两 边 
得 到 


2 了 + YH tls = oho (49.7) 
因此 
la! & ed Pil + sw 和 /ed 
A (49.8) 
这 给 出 
攻关 [owsal (ssf 十 62). (49.9) 
代 人 (49.5) 得 到 


al < Chel + sd)(l + 1 lena!), (49.10) 
因此 ,假若 m 和 奴才 不 小 , 则 剩余 向 量 7 小 。 


分 析 的 总 评述 


50， 首 迭代 有 以 下 渍 在 的 强 点 : 

(i) 因为 了 和 UU 是 用 部 分 主 元 案 方法 得 到 的 ， 有 一 个 小 小 
的 危险 ,这 就 是 鼠 的 元 素 可 能 比 4 的 大 得 多 。 在 这 种 情况 下 ,ez 会 
不 是 小 量 。 正如 在 第 四 章 557 我 们 指出 的 ,这 是 一 个 很 小 的 危险 ， 
可 以 用 完全 主 元 素 进一步 减轻 它 。 或 是 用 初等 Hermite 变换 作 
《4 一 p71) 的 正 交 三 钊 化 把 它 消除 。 我 认为 ,这 个 危险 是 可 以 忽 路 
的 (参见 $54, $56)。 

《ii 我 们 的 分 析 不 是 实际 证 明成 分 Bw 大 , 而 是 仅仅 证 朋 如 
时 在 二 中 xu 不 缺少 , 那么 et 大 ， 应 该 认识 到 ,我 们 不 能 证 明 
内 大 ,除非 对 特征 值 分 布 作 某 些 进一步 的 假定 ， 如 果 有 一 些 特 征 
值 十 分 舍 近 ,那么 w+ 的 “大 ”可 能 是 从 任 一 个 对 应 的 向 量 的 
大 成 分 得 来 的 。 这 个 弱点 是 不 可 避免 的 。 如 果 有 其 它 特征 值 奉 近 
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#， 这 意味 着 必 是 病态 的 ， 我 们 必定 会 在 某 些 范围 由 此 而 受到 损 
失 。 我 们 所 能 证 明 的 是 : 当 (4 一 p) 不 小 ，w+t 不 能 含有 任何 
xi 的 大 的 分 量 ， 因 为 《49.2) 两 边 的 * 的 分 量 相等 ,我 们 有 
Ch PB + YT Hvrnfss ~ os (50.1) 
lg < {evenla/ sl + lo 一 让 (50.2) 
如 果 只 有 改 是 靠近 ?的 特征 值 ， 那 么 大 的 west 意味 着 x 的 成 分 
必定 大 。 
(党) 如 果 在 初始 向 量 x 中 。 所 有 与 紧 靠 ?的 对 应 的 二 成 
分 非常 小 , 那么 舍 人 误差 可 能 抑制 它们 的 增长 。 因而 我 们 永远 得 
不 到 一 个 实质 性 地 含有 这 些 和 的 w。 似乎 情况 的 确 是 这 样 的 ， 
但 经 验 表 明 它 并 不 是 如 此 , 如 果 ? 非常 接近 li, 我 们 的 经 验 表明 : 
经 一 步 迁 代 非 常 欠缺 成 分 的 初始 向 量 ， 所 得 的 向 量 通常 合 有 
x 的 实质 性 的 成 分 。 


特征 向量 的 进一步 改进 


5I. 我 已 发 现在 我 用 来 计算 符 征 向 量 的 方法 中 ， 逆 迭代 是 最 
有 效 和 精确 的 方法 。 为 了 表明 它 的 效力 ,我 们 描述 怎样 用 它 给 出 
精确 到 运算 精度 的 结果 。 从 我 们 的 分 析 来 看 ， 用 (4 一 27) 的 固 
定 的 三 角 分 解 进行 运算 , 我 们 不 能 希望 比 得 到 方程 (48.3) 的 矩阵 
(4 十 了 ) 的 一 个 高 精度 的 特征 商量 更 好 的 结果 。 现在 我 们 知道 
对 应 于 三 角 分 解 ， 矩 阵 了 是 非常 小 的 。 但 是 ， 如 果 其 它 特征 值 接 
近 办 ,那么 计算 的 (4 十 R) 的 特征 向 量 不 可 加 免 地 含有 相应 的 特 
征 向 量 的 成 分 ,这 些 成 分 是 不 可 忽略 的 ， 钢 如， 如果 41 一 0(1)， 
机 ~ 1 为 一 1 一 27", 所 有 别 的 特征 值 都 与 这 两 者 明显 分 离 , 计 
算 的 特征 向 量 w 本 质 上 形 如 以 下 形式 : 


四 
z+ t+ D) giry, 
了 


其 中 。 可 能 是 2JFI/1ss1 量 级 ,并 且 st 是 1P1/2| 最 级 (第 二 剖 
$10). 
考虑 仍然 用 同样 的 三 角 分 解 。 同 样 的 计算 精度 我 们 是 否 能 得 
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到 比 « 更 精确 的 特征 向 量 是 有 意义 的 。 现 在 考 巾 方程 
(A— pI)x—# (51.1) 
的 准确 解 ， 显 然 ,我 们 有 
E29 Bx: Eire 
+ i Tt (51.2) 
因此 ， 如 果 ? 比 1 一 2-” 更 华 近 1， 那 么 规格 化 的 * 包含 的 成 
分 比 “ 的 小 得 多 .在 第 中 章 868，$ 69 中 ,我 们 讨论 过 高 精度 解 方 
程 组 的 问题 , 并 且说 明了 如 果 有 内 积累 加 并 且 〈4 一 27) 不 是 过 
于 病态 ,那么 方程 (51.1) 能 正确 地 求解 ,达到 运算 精度 。 
相应 地 我 们 提出 一 个 本 质 上 由 两 险 毁 组 成 的 格式 。 第 一 阶段 
我 们 按 下 述 定义 计算 序列 mm 
(4— pom ~ tts = oops/ maxC von). (51.3) 
这 个 迭代 继续 到 w 不 再 改进 为 止 。 二 新 令 最 后 一 次 迄 代 为 #, 这 
也 是 一 个 迭代 过 程 ， 它 与 第 一 阶段 的 迭代 有 许多 共同 之 处 ， 可 是 
它 有 完全 不 同 的 目的 。 
52. 考虑 如 何 选 取 # 以 便 得 到 最 好 的 效果 是 很 有 意义 的 。 ? 
被 取得 越 接近 入 ， 第 一 阶段 的 « 越 迅 速达 到 极限 精度 。 事实 上 ， 
如 果 我 们 取 f 一 2 十 0 (2"')， 那 么 几乎 两 次 选 代 就 达到 极限 精 
度 。 在 这 一 阶 自选 代 与 (4 一 p1) 的 病态 无 关 ， 现在 转 到 第 二 阶 
段 , 我 们 发 现 , 如 果 的 确 能 高 精度 地 解 (4 一 p1)* 一 w 那么 又 有 
了 ? 尽 可 能 接近 和 的 优点 。 因为 这 保证 了 在 * 中 的 成 分 的 相 
对 量 尽 可 能 小 。 另 一 方面 ， 取 了? 越 靠近 1，(4 一 p1) 变 得 越 病 
坊 , * 收 化 于 (4 一 Pp1)x 一 w 的 正确 解 越 慢 ， 直 到 最 后 (4 一 
了) 变 得 过 分 病态 ,不 用 更 高 的 运算 精度 就 不 可 能 得 到 正确 的 解 . 
为 了 避免 因 病 态 特 征 值 引起 的 复杂 性 ， 我 们 令 4 是 对 称 矩 阵 
使 得 全 部 特征 值 都 有 理想 的 条 件 。 为 方便 起 见 ， 假 定 |4j 一 1， 
可 轴 一 1 入 一 1 一 28 | < 之 0.5(i > 2)， :~ 48。 误差 矩阵 
的 大 小 取决 于 会 人 的 过 程 ， 我 们 假定 Fb 一 坟 2-*， 如 果 用 
和 好 表示 《4 十 了) 的 特征 值 和 特征 向 量 , 那么 我 们 有 
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[i— hl < nt smnt Dy ew, (2.0 
4 


其 中 
bel < n¥270 27 一 nt2 
He] < #827%/0.5 一 nt270(1 > 2). (52.2) 

只 要 丸 比 4 更 明显 地 接近 p， 那 么 在 第 一 阶段 选 代 将 收敛 于 允 ， 
仅仅 是 收敛 的 速 庶 受 影响 ,最 终 的 精度 不 受 损失 .每 一 次 迭代 ,到 
的 成 分 相对 于 马 的 成 分 桨 小 一 个 因子 (一 们 1/( 必 一 的 ,其 它 的 
成 分 缩小 得 更 快 。 现在 我 们 估计 两 个 不 局 ? 值 结合 的 方法 的 效 
率 。 

(D 2 一 1 一 27%。 在 第 一 阶段 ,其 的 分 量 与 吉 分 量 的 比 编 小 
一 个 倍数 ,这 倍数 小 于 

(8 二 1)2-8/[2 一 ( 叶 十 12- 林 。 

除非 4 非常 大 ， 一 般 两 次 迭代 几乎 肯定 是 够 的 ， 在 第 二 阶段 ， 
《4 一 p1) 非常 病态 以 至 于 我 们 完全 不 能 解 (4 一 p1)x 一 «. 

(Gi) 2 ~ 1 一 29， 在 第 一 阶段 ， 志 的 分 量 与 双 分 量 的 比 缩 
小 一 个 倍数 ,这 倍数 小 于 

(2 十 02 人 (2-9 — 2- — nt2"4), 

因此 ， 每 一 次 迭代 约 得 到 20 位 二 进位 数字 ,通常 三 次 迭代 几乎 肖 
定 是 足够 的 。 在 第 二 阶段 的 每 一 步 中 , (4 一 p1)x 一 « 的 解 的 相 
对 误差 压缩 一 个 因子 ， 这 因子 约 是 nt232-* 一 n32-8，。 例如 ， 
# 一 64， 四 次 迭代 确实 得 到 这 些 方程 解 的 正确 会 人 后 的 结果 。 准 
确 解 给 定 为 


BX 52.3 
Tp (52.3) 
规格 化 之 后 为 
st DD) ms nd 02-2, 
4 
1m] 于 2-92-aG > 2). (52.4) 


这 表明 计算 的 = 几乎 是 x 的 正确 的 会 人 的 结果 ， 并 且 特 征 向 量 
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的 病态 和 三 角 分 解 的 误差 全 都 已 克服 。 

如 果 丸和 为 比 这 个 例子 的 更 靠近 ,这 样 得 到 的 向 量 * 可 能 在 
运算 精度 范围 内 不 是 ma。 在 这 种 情况 下 ,第 二 阶段 可 以 重复 以 便 
得 到 (4 一 p1)y 一 * 的 较 精确 的 解 ,等 等 。 如 果 

(一 | < ?ni 
不 用 更 高 的 精度 运算 不 可 能 分 离 出 特征 向 量 za 

在 DEUCE 机 上 我 们 已 经 研制 了 这 一 技术 的 许多 程序 . 最 完 
效 的 是 从 一 些 近 似 的 特征 值 开始 寻找 复 矩 阵 双 精度 的 特征 向 是 .。 
计算 每 一 个 特征 向 量 时 仅 用 单 精度 的 三 第 分 解 ! 用 第 四 章 $ 69 描 
述 的 技术 可 以 决定 双 精 度 的 向 量 。 因为 如 该 节 的 第 (i) 部 分 指出 
的 ,在 方程 (4 一 p1)* 一 中 可 以 用 双 精 度 的 右 端 而 不 必 执 行 任何 
双 精 度 的 运算 。 这 个 DEUCE 程序 是 一 个 杰作 , 在 有 大 的 高 速 存 
储 的 计算 机 上 用 真正 的 双 精 度 计算 也 许 会 更 经 济 、 但 是 这 个 程序 
使 我 们 对 逆 和 迭代 的 性 质 有 很 深信 的 认识 ， 它 也 提供 了 关于 计算 向 
量 的 精度 可 单 的 指示 。 有 意义 的 是 ,这 个 可 移 的 估计 可 以 从 为 和 
如 得 到 ,而 只 需要 有 其 它 的 特征 值 的 粗 路 的 估计 。 

非 线性 初等 因子 

53， 当 4 有 非 线性 初等 因子 时 ,对 一 切 ? 值 ，(4 一 并) 一 也 
同样 有 非 线性 因子 ， 在 $ 16 中 我 们 已 看 出 ,对 应 非 线性 初等 因子 
的 主 特征 向 量 的 收 合 性 是 “ 慢 " 的 。 乍 一 看 来 , 使 用 逆 迭 代 什么 收 
获 也 得 不 到 ,但 是 事实 上 并 非 如 此 . 

考虑 简单 的 Jordan 子 算 阵 

4a=[*! ]. (53.1) 
如 果 取 p 一 4 一 8， 我们 有 ol 
(4 — pI) ‘= ]. (53.2) 
因为 我 们 对 常数 因子 不 感 兴趣 , 逆 先 代 实 际 上 等 价 寺 算 阵 
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的 直接 迭代 。 当 s 小 时 ,从 任何 一 向 量 开 始 ,一 次 迭代 后 我 们 立 邑 
得 到 追 近 那 唯一 的 特征 向 量 的 一 个 好 的 近似 。 青 选 代 下 去 确实 得 
不 到 本 质 上 的 改进 ,这 对 应 于 $16 的 分 析 中 a 是 小 的 情况 ,) 


Hessenberg 矩阵 的 逆 迁 代 


54. 我 们 讨论 了 用 满 矩 阵 的 逆 挝 代 ， 但 是 实际 上 更 方便 的 是 
先 寻 找 与 原 矩阵 根 羽 的 下 缩 型 也 的 特征 向 量 ， 然 后 从 它 导 出 矩阵 
4 的 特征 向 量 。 因 为 有 许多 稳定 的 方法 约 化 矩阵 为 上 Hessenberg 
型 玉 ， 我 们 先 考虑 这 种 形式 。 

在 第 四 章 $33 中 已 经 讨论 过 用 部 分 主 元 素 法 作 Hessenberg 
姑 阵 的 三 角 分 解 .因为 用 合乎 Gaus 消去 法 的 术语 来 说 ,在 约 化 中 


每 步 只 有 一 个 非 堆 科 子 ,所 以 特别 简单 .请 拓 隆 的 约 化 有 十 个 条 
法 ,而 这 种 矩阵 只 有 3 个 乘法 ， 因 为 二 仅仅 包含 (* 一 1) 个 次 
对 角 线 元 素 , 求解 Ly 一 Pé (见方 程 (48.2)) 只 包含 4 个 乘法 ， 所 
以 ,每 一 次 迭代 中 约 有 过 李 个 乘法 而 满 类 了 有 辣 个 汇流 。 


和 第 五 章 $ 54 一 样 ， 我 们 不 直接 选 定 初始 向 量 *， 而 是 假定 
它 满 足 


工 e 一 Pu, (54.1) 
其 中 。 是 元 素 全 为 1 的 商量 ， 因 此 , o 从 求解 Vm 一 “得 到 。 如 
果 ? 十 分 舍 近 一 个 特征 值 ， 那 么 通常 两 次 渤 代 就 够 了 ， 假 如 2 是 
一 个 准确 的 特征 值 ,并 且 分 解 是 准确 地 实行 的 话 ,那么 如 的 一 个 对 
和 角 线 元 素 ( 加 果 玉 没有 次 对 角 线 元 素 是 零 ， 它 就 是 最 后 一 个 ) 就 会 
是 零 ， 但 是 ， 实 际 上 计算 的 对 角 线 元 于 没有 一 个 必定 是 小 的 。 如 
果 避 的 一 个 对 角 元 是 零 , 它 可 以 用 27Hil 代替 ,但 是 使 用 $55 描 
述 的 技术 是 更 经 济 的 。 
在 这 里 我 们 指出 ， 当 x 是 一 个 准确 的 特征 值 并 且 计算 是 准确 
地 执行 时 ,用 Hymn 的 方法 (第 七 章 $ 11) 得 到 的 向 量 * 是 准确 的 
特征 向 量 。 可 是 , 虽然 Hyman 方法 决定 特征 值 的 过 程 是 十 分 稳 
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定 的 ,但 是 决定 对 应 的 特 徙 向 量 时 常 是 极 不 称 定 的 .在 这 方面 不 应 
用 Hyman 方法 。 事 实 上 ， 当 互 正巧 是 三 对 角形 矩阵 ， 用 Hyman 
方法 给 出 的 向 量 精确 地 等 于 第 五 章 $ 48 的 方法 给 出 的 向 量 , 并 且 
我 们 已 经 说 明 它 为 什么 不 稳定 。 通 过 一 个 完全 类 似 的 分 析 ， 我 们 
可 以 证 明 , 当 规 格 化 的 左 特征 向 量 y, 第 一 个 分 量 小 时 ,Hyman 方 
法 给 出 的 ” 的 近似 向 量 是 不 好 的 ， 甚 至 用 准确 到 运算 精度 的 4 
值 ,准确 地 执行 三 yman 方法 也 仍然 如 此 。 


退化 情况 


55. 当 一 个 次 对 角 线 元 素 tw 为 零 时 , 我 们 可 以 把 豆 写 为 如 


下 形式 
H B 


n=-[ ， 
0 也 
其 中 也 ， 孔 是 Hesenberg 型 ,于 是 妃 的 特征 值 是 可 和 瑟 : 的 全 
都 特征 值 。 对 应 于 到 的 特征 值 的 特征 向 量 由 互 的 相应 的 特征 向 
量 在 最 后 增添 "一 ;个 零 给 出 , 因此 涉及 的 计算 量 较 小 ， 对 应 于 
孔 的 特征 值 的 特征 向 量 一 般 没有 特殊 性 , 决定 它 的 最 经 济 的 方法 
是 逆 选 代 法 ， 

如 果 互 有 * 重 的 特征 值 ,对 应 * 个 独立 的 特征 向 量 , 它 必定 至 
少 有 (r 一 D) 个 零 次 对 角 线 元 素 (参见 第 七 章 $ 41)。 尽 管 如 此 ,二 
可 能 有 特征 值 在 运算 精度 内 相等 而 根本 没有 小 的 次 对 角 线 元 素 . 
在 这 种 情况 下 ， 如 的 独立 的 特征 向 量 可 以 用 稍 敏 不 同 的 值 执行 
递 选 代 得 到 ,原理 是 与 第 五 音 $59 的 一 样 . 

当 五 有 非 线性 初等 因子 (4 一 4) 时 ,用 不 同 的 但 接近 妈 的 ? 
全 得 到 向 量 将 十 分 徘 近 。 逆 选 代 不 出 现 有 秆 复 的 线性 因子 时 保证 
我 们 获得 独立 的 特征 向 量 的 “不 稳定 性 "特征 ,通常 , 当 妞 有 一 个 一 
次 因子 时 ,计算 的 特征 值 是 不 相等 的 ,但 是 差别 仅 是 2-*|8| 的 数 
量 级 (参见 第 二 章 $ 23)。 用 两 个 差别 为 2-% 的 量 执行 道 选 代 决 
定 特征 向 量 as 和 za, 而 (x 一 za) 给 出 一 个 第 二 级 主 向 量 , 但 是 它 
自然 至 多 只 有 去 /位 正确 数字 (参见 第 三 章 $ 63). 
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带 形 矩 隆 逆 选 代 


56. 在 矩阵 是 三 对 角形 的 情况 十, 逆 迭 代 更 节省 , 这 一 点 我 们 
在 第 五 章 涉及 对 称 矩阵 时 曾 讨 论 过 。 因为 没有 利用 对 称 的 特点 ， 
其 中 的 思想 可 以 立即 应 用 到 非 对 称 情况 ， 除 非 实 矩 阵 有 某 些 复 特 
征 信 。 

正如 第 六 章 中 所 看 到 的 ， 没 有 一 个 约 化 一 般 矩 阵 为 三 对 角 型 
的 方法 是 无 条 件 地 保证 数值 稳定 的 。 由 于 这 个 原因 , 当 三 对 角形 
抵 阵 是 从 一 般 的 矩阵 经 过 中 得 的 Hessenberg 矩阵 推导 出 来 的 时 ， 
我 们 建议 从 Sessenberg 矩阵 寻求 特征 向 量 , 而 不 要 从 三 对 第 型 去 
找 ， 此 外 , 当 Hesscnberg 抵 阵 的 一 个 特征 向 量 已 经 计算 时 ， 应 该 
用 直接 迭代 法 改善 特征 值 。 因为 由 Hessenberg 型 约 化 为 三 对 角 
型 时 如 果 有 一 点 不 稳定 ,那么 结果 就 不 够 准确 .我 们 着 重 指出 : 如 
果 我 们 找到 了 三 对 角 抵 阵 的 特征 向 量 ， 为 了 得 到 原 矩 阵 的 特征 商 
量 ,我 们 在 任何 情况 下 都 必须 从 它 找 Hessenberg 抱 阵 的 特征 向 量 ， 
所 以 找 Hessenberg 矩阵 的 特征 向 景 是 相当 重要 的 。 

在 偏 微 分 方程 的 特征 值 问题 中 有 带宽 大 于 3 的 带 形 矩阵 。 通 
常 这 种 矩阵 是 对 称 正定 的 。 但 是 因为 我 们 必需 用 (4 一 p1) 运算 ， 
正定 性 不 可 避免 地 失掉 ,除非 ?接近 最 小 的 特征 值 。 所 以 ,在 三 角 
分 解 时 必须 使 用 行列 交换 ， 结 果 我 们 得 到 的 是 P(4 一 ?1) 的 分 
解 ,其 中 了 是 置换 矩阵 ， 如 有 果 我 们 写 

P(A4— PI)= LLU, (56.1) 

那么 容易 验证 ， 如 果 4 的 带宽 是 2(m + 1)， 则 工 的 每 一 列 对 角 
元 之 下 仅 有 wr 个 非 零 元 素 ( 除 了 最 后 w 列 )，U 的 每 一 行 有 多 至 
{2m 十 1) 个 非 堆 元素 .。 不 用 交换 的 算法 是 吸引 人 的 ， 但 是 不 合 
理 ,特别 是 计算 中 向 的 特征 值 更 是 如 此 。 我 们 注意 ,不 管 4 是 不 是 
对 称 矩 阵 , 这 些 评 论 都 是 对 的 . 

这 个 方法 已 经 在 ACE 上 用 来 找 1500 阶 带宽 为 31 的 对 称 绝 
阵 的 某 些 特征 向 量 。 从 一 个 适当 的 特征 值 开 始 的 ， 使 用 Rayleigh 
商 来 使 我 们 得 到 十 分 高 精度 的 特征 值 ,而 基本 上 没 增 加 工作 量 。 
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复 共 轿 特征 向 量 


57. 从 误差 分 析 的 观点 来 看 ， 实 矩阵 的 复 特征 向 量 的 计算 是 
特别 有 意义 的 。 假 定 (所 十 种) 是 一 个 复 特征 值 ， 是 对 应 的 特 
征 向 量 , 并 且 我 们 有 一 个 (5, 十 imw) 的 近似 值 4 二 8 十 二 , 逆 迭 
代 可 以 用 许多 不 同 的 方式 执行 : 

《iD 我 们 可 以 用 

《4 一 个 十 in) wn ss sn Werfmax( wn) (57.1) 
计算 复 向 量 和 w, 的 向 量 序 列 。 这 里 的 全 部 计算 在 必要 之 处 都 
要 用 复数 运算 ,通常 w, 挡 向 于 一 个 复 特征 向 量 . 

《0) 我 们 可 以 完全 用 实 运算 来 执行 ,做 法 如 下 : 我 们 记 

ob 二 有 


和 《57.1) 的 第 一 个 式 子 中 实 部 和 虚 部 分 别 相等 ,得 出 


(4 — EI)un + Wom ™— Ps (57.2) 
nt (A — SI)vns 一 gs (57.3) 
我 们 可 以 把 它 写 为 
[多 | [ nl |[ 当 
C0) | 一 一 一 | -------— -| | -一 - 
Vat —m 开 4 一 红 」 vo 
所 
一 | | (57.4) 
qs 
这 是 24 个 变量 的 实 方程 组 


《i) 从 (57.2) 和 (57.3) 我 们 可 以 导出 下 式 
[(4— 51P+ wrilun— (A— SI)p,— ng (57.5) 
[((A— EY+T Tl gp t+ (A— &1)g, (57.6) 
这 两 个 方程 级 的 系数 矩阵 相同 ,都 是 实 ” 阶 方 阵 ,因此 仅 需 一 次 三 
角 分 解 ,并 且 只 涉及 ” 阶 实 方 阵 。 
(iv) 向 量 w+ 和 ”ro 可 以 由 解 《57.5) 并 利用 (57.2) 来 决 
定 ,也 可 以 由 解 《57.6) 并 利用 (57.3) 来 决定 。 
如 果 个 十 妆 ) 不 是 准确 的 特征 值 , 在 这 到 个 方程 中 没有 一 个 
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系数 矩阵 是 奇异 的 .各 个 方程 的 解 都 是 唯一 的 并 且 是 恒 等 的 。 至 
于 它们 在 实际 计算 中 有 差别 , 这 完全 是 会 人 误差 的 结果 。 值得 注 
意 的 是 ,方法 (i)，(ii) 和 (iv) 能 收 化 于 复 特征 向 量 , 但 是 ( 阁 ) 却 
不 能 . 

58. 在 给 出 误差 分 析 之 前 ， 我 们 先 确 定 各 个 方程 的 系数 答 阵 
的 特征 向 量 ， 

我 们 把 (4 一 27) 看 作 复 域 上 的 矩阵 , 它 有 特征 值 《4 一 4) 
和 (于 一 和 ), 有 对 应 的 特征 向 量 和 末 。 当 1 趋向 于 和 时 ,第 一 
个 特征 值 趋向 于 零 , 但 是 第 二 个 则 不 然 .因此 一 般 而 言 (4 一 47) 
的 秩 是 《2 一 1). 

矩阵 8(4) 一 (4 一 红 》 十 WI 是 4 的 多 项 式 , 因此 也 有 它 
们 对 应 于 特征 值 (4 一 5 十 PP 和 (一 8》 十 党 的 特征 向 量 
各 和 名, 当 1 趋向 于 为 时 ,这 两 个 特征 值 都 趋向 于 零 .因此 一 般 而 
言 B(%) 的 秩 是 (s 一 2), 因为 它 有 两 个 独立 的 特征 向 量 = 和 


EF 


现在 转 到 (57.4) 的 矩阵 C(2)。 我 们 立即 验证 


[和 到 al a | 
| 


= [Ch ~— §)+im] | 了 芯 -| (58.1) 
土 iws 
和 
A—sli ol 名 
[二 和 一 红 | | 过] 
~ [一 和 tin] [过 (58.2) 
十 过: 


因此 ，C(%) 有 四 个 特征 值 (% 一 习 士 税 和 (太一 各 十 各， 有 四 
个 对 应 的 独立 的 特征 向 量 。 于 是 我 们 有 
(nin>0 
htin>0 


} + (58.3) 
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这 表明 C(4) 有 两 个 零 特 征 值 对 应 两 个 独立 的 特征 向 量 
Lx 一 ix8i 和 [TI]， 因 此 CC44) 的 秩 是 24 一 2， 
误 林 分析 

59. 从 这 些 简单 的 结果 我 们 能 够 很 简便 地 看 出 ,方法 (过 ) 在 实 
际 计 算 中 为 什么 会 失败 ， 当 我 们 用 有 两 个 特征 值 很 靠近 零 的 任何 
撼 降 作 逆 选 代 时 ， 所 有 向 量 的 成 分 除了 对 应 于 这 两 个 小 特征 值 
之 外 都 很 快 缩 碱 ， 所 以 迭代 向 量 落 在 两 个 有 关 的 特征 向 量 张 成 的 
子 空间 内 。 在 这 空间 中 得 到 的 特定 的 向 量 密切 地 依赖 于 精细 的 合 
人 误差 ,这 向 最 甚 至 每 次 选 代 都 发 生变 化 。 

方法 (i) 没有 什么 有 意义 的 特点 , 矩阵 只 有 一 个 小 特征 值 , 迁 


代 很 快 收敛 于 =:。 全 部 运算 是 复 的 ,但 是 在 三 角 分 解 中 只 有 二 到 
个 复 乘法 ,在 每 一 次 迭代 中 有 迪 个 复 乘法 。 


在 方法 〈i) 中 每 一 步 得 到 的 疯 量 [ef io ] 必定 是 实 的 ， 它 收 
伍 于 由 [xz 和 一 zz 和 [于 j 交 7] 张 成 的 子 空间 中 的 一 个 向 量 。 


此 ,其 形式 必定 是 
a[zTi—ixt] + BLxriixT]. 
所 以 它 给 出 一 个 很 满意 的 复 向 县 : 
《ax 十 az) + i(—ion 十 iaR) 一 2cxr。 (59.1) 


在 方程 (让 ) 中 ,向量 w 和 ” 显然 是 实 的 , 并 且 很 快 收敛 于 x“ 
和 名 张 成 的 向 量 , 因 此 , 当 其 他 的 向 量 的 成 分 已 经 消失 时 ( 当 1 十 
分 接近 入 时 ,这 种 状态 应 该 立刻 呈现 出 来 ), 我 们 有 
Ws = xi 十 RRs vs = Brs + BR, {59.2) 
但 是 ， 我 们 没有 理由 期 望 和 8 之 阅 将 有 某 种 关系 。 由 这 个 方法 
给 出 的 复 特征 向 量 是 
wiv = (ot i + (a+ iB)E, (59.3) 
并 且 这 不 是 = 的 倍数 ,虽然 和 ” 是 实 向 置 ,它们 张 成 的 子 空间 
与 “和 名 的 一 样 ， 但 是 向 量 (w 十 zo) 不 是 飞 的 倍数 ,并 且 要 得 
到 后 者 还 需要 作 进 一 步 的 计算 ， 
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在 方法 (iv) 中 ， 拒 们 利用 方程 (57.2) 确 实 得 到 与 w+ 配对 的 
正确 的 实 向 量 w+。 在 极端 的 情况 ， 即 1 在 运算 精度 内 等 于 
时 , 我 们 发 现 方程 (57.5) 的 解 wy 大 于 ps 和 4， 它们 相差 FE 
数量 级 的 因子 ， 其 中 F 是 《4 一 红 》 十 ww 了 的 分 解 产生 的 误差 
甜 阵 。 因 此 , 在 方程 (57.2) 中 , p, 是 可 忽略 的 , 并 且 计 算 的 wt 本 
质 上 满足 


Mm (A — ST)urs 
一 一 (4 —s1)(ax + a71) 
as Mt EE Lu, (59.4) 
然后 由 (59.2) 得 出 
qs vi) = nr 十 BR 十 en 一 Enz — 20mr, (59.5) 
这 表明 (wn 十 io 的 确 是 x, 的 倍数 。 

(i) 不 正确 地 给 出 w+ 和 w+ 的 关系 这 一 事实 在 2 X 2 从 
阵 的 情况 是 相当 明显 的 。 事 实 上 ,容易 看 出 ,即使 (p, 十 i9:) 是 正 
确 的 特征 向 量 ，(w+: 十 ?+ 可 以 是 任意 坏 的 。 这 是 因为 在 
2 X 2 的 情况 下 B(h) 一 0。 六 此 ， 如 果 我 们 用 准确 到 运算 精度 
的 1 来 计算 B(2), 那么 这 个 第 阵 只 是 由 舍 人 误差 组 成 , 所 以 它 可 
用 2-*P 来 表示 ， 其 中 ?是 与 4 数量 级 相同 的 任意 矩阵 。 如 果 
(ps 十 i9;) 是 特征 向 量 ,那么 (57.5) 与 (57.6) 的 右边 分 别 是 一 299, 
和 2%msP;。 不 计 常 数 因子 ,我 们 有 

wm —P gs wn Pp, (59.6) 
又 因为 矩阵 P 是 任意 的 ， 我 们 不 能 期 望 w+ 和 w+: 有 正确 的 关 
系 . 

我 们 已 经 研究 了 2 准确 到 运算 精度 的 极端 情况 . 当 41 一 1， 
并 且 人 4 一 入 | = 2 忆 那么 即使 在 最 有 利 的 情况 下 , 方法 (种 ) 将 
给 出 形 如 (x 十 ez) 的 特征 向 量 , 其 中 6 是 24"' 数量 级 ， 当 趋 
于 1, + 的 成 分 变 得 与 的 数量 级 相同 。 


数 估 例子 
60. 在 表 3 中 我 们 说 明 用 $ 57 的 方法 〈iD,( 让 ) 和 (iv) 计算 
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训 3 


0.59797 0.292I0 0.15280 了 
4 十 | 一 0,95537 0.75756 一 1.23999 | A=0.82197 十 0-.7133 开 
0,50608 0.13706 。 0.40117 
I 


1.00000 
0.00000 1.00000 
一 0.52972 —0.14450 -1.00000 
0.00000 0.00000 0.66104 -1.00000 
0.23446 3124 一 0.41157 0,40774 1.00000 
0.74565 一 0.06742 一 0-85798 一 0.68110 v.00400 1.00000 
a 
一 0.95537 一 0.05441 一 1.23999 0.00000 —0.71237 。 0.00000 
一 0.71237 。 0.00000 一 0.95537 一 0.06441 一 1.23999 
一 1.07765 一 0.13805 0.36805 0.53319 
0.59734 ”一 0.10624 —0.77326 
0.00000 0.00001 


0.00000. 
《第 一 个 外) X10 《第 二 个 解 )X10“” 规格 化 的 第 一 个 和 第 二 个 解 
—0.19254 .16158 0.05538 一 0.372337 
—3.47674 —3.80567 1.00000 十 0.00000: 
0.32894 0.64769 —0.09461 一 0.287635 
1.2945t 1.47236 
0.00000 1.00000 
1.00000 1.00000 
(4 — E17 4 5 bs 
0.35591 —0.06330 —0.46073 —0.49147 0.93327 
一 0,35200 0.06260 0.45568 2.97214 一 [54740 
一 0.45726 0.08132 0.59492 一 0.49003 0 .93471 
已 Ds 
1.00000 0,35591 一 0.06330 —0.46073 
一 1.28476 1.00000 一 0,00001 一 0.00001 
一 0.398905 0.00000 1.00000 ) 0.00001 
解 1( 从 方程 (57.3) 和 (57,2) 得 ) 规格 化 的 解 1 
一 366219 一 2287628 0.05538 一 0。3723 条 
457966 一 1051690 1.00000 + G0.00000# 
—345821 一 322228 一 0.09461 一 9。28763 


一 一 一 
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名 表 3 


解 2( 众 方程 657.6)》 和 (37.3) 得 ) 规格 化 的 解 2 

一 41426 一 107670# 0.05540 一 0.37232 

2667328 一 1509354 1.00000 + 0.000008 

一 58649 一 624392 一 0.09461 一 0.28763 

解 3《 从 方程 (57.5) 和 (57.6) 得 ) 规格 化 的 解 3 不 中 一 个 近似 的 特征 向 量 

一 366219 一 107670 
457966 一 150935; 
一 345821 一 6243 中 


一 个 三 阶 实 和 矩阵 的 复 特 征 向 量 的 结果 .已 经 用 准确 到 运算 精度 的 
1 一 0.82197 十 0.71237 执行 了 逆 迭 代 。 我 们 首先 给 出 《57.4) 的 
6 X6 实 矩阵 C(1) 的 有 交换 的 三 角 分 解 ， 用 ;和 UU, 表示 它们 
三 角形 第 阵 , U, 的 最 后 两 个 对 角 线 元 素 是 零 . 这 一 事实 最 明显 地 
表示 C(%) 有 两 个 特征 值 十 分 靠近 零 ， 在 第 一 次 挝 代 中 ,我 们 开 
始 可 以 取 。 作为 右 端 进行 向 后 回 代 ， 显 然 ， 我 们 可 以 到 解 的 最 后 
两 个 分 量 为 任意 大 的 值 和 任意 的 比例 。 右 让 的 分 量 实质 上 被 忽 
略 ， 我 们 已 经 计算 了 两 个 解 ， 最 后 两 个 分 量 在 一 种 情况 下 取 为 0 
和 10， 另 一 种 情况 下 到 为 10' 和 10"。 虽然 这 两 个 实 解 是 完全 不 
同 的 ， 但 是 对 应 的 规格 化 复 特征 向 量 在 运算 精度 内 都 等 于 真正 的 
特征 向 量 . 

搂 着 我 们 给 出 3 x 3 实 矩 阵 8(2) 的 三 角 分 解 。 用 和 Us 
表示 三 角形 矩阵, 在 U 中 有 两 个 对 角 线 元 素 几 乎 是 零 ， 这 又 一 次 
明显 地 表示 有 了 两 个 十 分 接近 零 的 特征 值 。 我 们 把 〈e 十 ei) 作为 
初始 复 向 量 执行 了 一 步 ， 在 方法 〈 诈 ) 中 ， 右 庙 《4 一 $1)e 一 ne 
和 (4 一 81)s 十 ge 分 别 记 为 志和 性 ,由 方法 《iv) 得 到 的 向 量 
都 准确 到 最 后 一 位 数 的 2 个 单位 。 用 方法 〈 年 ) 得 到 的 向 量 完全 
不 对 , 那 是 m 和 五 的 一 个 组 合 。 


广义 特征 值 问题 


61, 逆 迭 代 方法 立刻 被 推广 到 广义 特征 问题 《第 一 章 $ 30)， 
考虑 最 常见 的 情况 就 足够 了 ,这 就 是 决定 1 和 r*, 使 得 
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(AV + BA+ Cr— 0, (61.1} 
罗 为 关 个 情 吕 等 从 二 标准 竺 征 信 问 是 


0 
[= 
一 个 相应 的 选 代 过 程 为 
| 一 好 | 工 网 
ee | 
其 中 是 一 个 近似 特征 值 ，( 为 了 方便 超 见 ,我 们 省 略 了 规格 化 ,) 
由 方程 (61.3) 我 们 得 


| 《61.3) 


hn Yon bh, 
—ATCrn— ATBysn 一 My 一 yy (61.4) 
因此 
—COm— rs) ~ Bmn— VAyn = AAys, (61.5) 
(VATNB + Cm = Cx,— 449,, {61.6) 
于 是 向 量 %+ 和 zs 可 以 分 别 从 (61.6) 积 (61.4) 计算 。 这 仅仅 
需要 (24 十 48 十 C) 的 一 次 三 角 分 解 。 
在 4, B,C 是 参数 了 的 函数 ,并 且 希 望 探 索 了 变化 时 特征 值 
3 和 对 应 的 特征 向 量 ma(7) 的 相应 的 变化 铺 况 时 ,这 个 方法 是 
非常 有 效 的 ; 对 于 以 前 的 各 个 了 上 值 ，2a(F) 和 ma(7) 可 以 用 作客 
们 的 当前 秆 的 好 的 初始 近似 值 . 


近似 特征 值 的 变更 


62. 到 目前 为 止 ， 我 们 研究 的 道 近代 法 对 每 一 个 特征 值 选用 
一 个 酒 定 的 近似 值 , 久 而 每 决定 一 个 特征 向 量 只 要 一 次 三 角 分 解 。 
当 特 征 值 的 近似 值 十 分 加 真 时 ,这 个 方法 是 极其 有 效 的 。 收敛 的 
速度 很 快 以 至 于 在 利用 当前 所 能 得 到 的 最 佳 近似 值 时 涉及 的 额外 
的 三 角 分 解 都 不 必要 ， 

另 一 个 途径 是 一 开始 就 用 逆 选 代 来 定 特征 值 。 当 4 是 对 称 矩 
阵 时 ,一 个 方便 的 迭代 过 程 定义 为 (参见 第 三 章 3 54) 
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(A ~ ul) = ss 

pn hiAonfo vm, (62.1) 

wp = pn/ (vpn) i 
在 每 一 步 ,用 对 应 于 当前 的 向 量 的 Rayleigh 商 给 出 特征 值 的 新 的 
近似 值 。 容 易 证 明 ， 这 个 选 代 过 程 在 每 一 个 将 征 向 量 的 邻 域内 是 
三 次 收敛 的 。 我 们 假定 


pr k++ DBixis 《62.2) 
其 中 "表示 不 合 下 标的 各 项 的 求 和 ,于 是 
因此 机 一 《入 十 et)AC1I + De), {62.3) 
vn rf Me Oo pe) + PBsri (hs — p). (62.4) 
不 计 规 格 化 因子 ,我 们 有 


《一 ti 人 一) 


DO A any 一 
一 + Bro /C0 一 625) 


所 有 系数 除了 x4 的 之 外 都 是 8; 的 三 次 方 。 
对 于 非 对 称 和 矩阵 有 一 个 类 似 的 方法 ， 每 一 步 寻 找 一 次 近似 的 
左 , 右 特征 向 量 。 这 个 方法 由 下 列 关系 式 定义 
(A— 丁 门 pp (A— pl)gn~p,, 
pn ea 有 (62.6) 
wn vn/max(vn), prt ™ genrfmax( gn). 
(4 一 pl) 的 三 角 分 解 使 我 们 能 决定 vs 和 9.+。 现在，pui 的 
当前 值 是 对 应 于 9,*， 和 vrs 的 广义 Rayleigh 商 (参见 第 三 章 
$58). 
这 个 方法 最 后 也 是 三 次 收敛 的 ， 我 们 假定 有 
wt D6, pi = H+ Dmyes 《62.7) 
那么 
p= Chrt 十 Dr hemy Fx) /yre 十 TemyT zi). 《62.8) 
因此 ,不 计 规格 化 因子 ,我 们 有 
Wn er Oo pp), (62.9) 
Pn nt Ho Em/ Oo wy), (62.10) 
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所 有 系数 除了 x 和 3 的 之 外 都 是 5; 和 省 的 三 次 方 。 如 果 鸡 的 
条 件数 四 rt 小 ,三 次 收敛 性 的 出 现 就 推迟 ， 

虽然 往往 是 在 达到 三 次 收敛 范围 的 时 候 运 算 精度 限制 了 准确 
性 再 提高 的 可 能 性 .但 极限 的 收敛 率 显然 是 十 分 令 信 满意 的 。 如 
果 需 要 比较 精确 的 特征 值 ， 它 们 可 以 通过 小 心地 计算 最 后 的 
Rayleigh 商 或 者 广义 Rayleigh 商 得 到 ,通常 ,在 这 个 阶段 ,准确 的 
Raylcigh 商 的 正确 福 超 过 单 精度 ， 如 果 我 们 计算 

(A — pl)wns 

ph pe + Wha A — pl uaf ums (62.11) 

或 者 在 非 对 称 的 情况 下 ,计算 
《4 pT utis 

RR (62.12) 
那么 不 用 双 精 度 就 可 相当 精确 地 定 出 那些 商 .向 量 (4 一 ps1)wit 
应 该 用 内 积累 加 计算 。 大 量 的 相约 会 正常 地 发 生 ， 并 且 单 精度 的 
(4 一 m1)wyi 可 用 来 决定 w+。 

Ostrowski《1958，1959) 在 一 系列 的 论文 中 已 经 给 出 这 些 
方法 的 十 分 详尽 的 分 析 ， 读 者 参阅 这 些 论文 可 以 得 到 更 丰富 的 知 
识 . 

决定 左 、 右 特征 向 量 是 费时 的 。 如 果 已 知 特征 值 的 一 个 相当 
好 的 近似 值 p, 那么 简单 的 道 迄 代 的 收 售 性 无 论 如 何 是 合适 的 , 直 
接 选 代 、 逆 迭 代 和 收缩 可 以 这 样 结合 起 来 。 直接 迭代 可 执行 到 到 
得 一 个 相当 好 的 ps 值 ， 并 且 附 带 得 到 一 个 好 的 近似 特征 向 量 为 
北 ,然后 用 这 向 量 和 固定 的 zw 值 开始 用 (4 一 mwl) 作 选 代 。 最 后 
当 决 定 了 特征 向 量 以 后 就 执行 收缩 。 当 4 是 复 矩 阵 时 ， 这 是 一 个 
特别 有 效 的 方 涛 。 一 个 使 用 这 个 方法 的 极 好 的 说 明 见 Osborne 
(1958). 


特征 系 的 改进 


63. 作为 我 们 最 后 的 一 个 题目 ， 我 们 考虑 计算 的 特征 系 的 改 
* 原文 误 为 J。 一 一 译 者 证 
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进 。 在 $51 中 我 们 已 经 证 明了 用 逆 挝 代 通常 可 以 确定 对 应 于 最 
接近 指定 的 ?的 那个 特征 值 移 特征 向 量 并 达到 任何 指定 的 精度 ， 
虽然 在 实际 计算 中 这 个 方法 关于 计算 的 特征 向 最 的 精度 方面 是 令 
人 信服 的 ,但 不 可 能 用 它 去 得 到 一 个 严格 的 界 . 

在 第 三 章 559 ~ $64 中 我 们 从 理论 的 观点 讨论 了 改善 完全 特 
征 系 的 问题 。 现在 我 们 详细 叙述 一 个 利用 该 节 的 思想 的 实 际 方 
法 。 在 ACE 上 已 编 了 定点 运算 的 程序 ， 我 们 就 用 这 种 形式 来 描 
述 它 。 修 改 它 为 浮 点 计算 是 十 分 简单 的 . 

假定 用 某 些 方法 决定 了 一 个 近似 的 特征 系 。 我 们 用 六 和 民 
表示 计算 的 特征 值 和 特征 向 最 ，X" 表示 特征 向 量 甜 阵 , 剩 余 逢 阵 
由 下 式 定义 


AX’ ~ Xr'diag(X) + Fy 
(KYAK' 一 diag(H) 4 (XE, (63.1) 
我 们 假定 | 《4i|, 不 然 的 话 , 和 x; 几乎 不 能 看 作 是 一 个 近 
似 的 特征 系 。 在 ACE 上 ,的 每 一 列 天 是 内 积累 加 准确 地 计算 
的 ,所 以 天 的 分 量 都 是 双 精 度 的 。 虽然 从 我 们 关于 的 假定 看 出 ， 
在 每 一 个 分 最 的 第 一 个 字 中 大 部 分 数字 都 是 零 、 因 而 每 一 个 向 量 
所 都 表示 为 2-*igi 的 形式 ， 其 中 扎 的 选取 是 使 得 18:| 的 极 大 元 


素 落 在 十 和 1 之 陪 , 换 名 活 说 , 每 一 个 天 转换 为 规格 化 双 精 度 块 


浮 点 向 量 。 

到 旭 前 为 止 还 没有 发 生 合 人 误差 。 下 一 步 ， 我 们 希望 以 此 较 
方便 地 得 到 的 精度 去 计算 (X EF. 在 ACE 上 用 的 是 第 四 章 $ 69 
撞 述 的 迭代 法 计算 的 , 首先 用 带 交 换 的 方法 执行 Z 的 三 角 分 解 , 然 
后 用 近代 法 解 每 一 个 方程 X'h 一 8。 注意 ,在 第 四 章 描述 的 方法 
中 采用 了 内 积累 加 的 单 精度 计算 ,但 是 正如 我 们 所 指出 的 ,可 以 用 


双 精 度 的 右 端 ， 只 要 "2 4(X) -中 < 十， 过 代 过 程 收敛 并 且 给 出 


的 方程 X% 一 gt 的 解 五 准确 到 运算 精度 ， 如 果 我 们 令 bi 一 
2 己 / 加 那么 我 们 有 
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(XIAX = disg(W) 十 P 十 下 一 了 (63.2) 
其 中 了 的 每 一 列 p; 是 已 知 的， 并 且 是 单 精度 块 浮 点 向 量 的 形式 ， 
矩阵 0 不 是 明显 已 知 和 的 。 但 是 按照 我 们 的 假定 , 这 个 迷 代 过 程 给 

出 准确 会 人 后 的 真 解 。 因 此 ,我 们 有 
lg < 2 人 (63.3) 

4 的 特征 值 与 8 的 准确 地 相等 . 

4. 现在 我 们 可 以 用 Gerschgorin 定理 (第 二 章 $ 13) 决定 了 
的 特征 值 的 位 置 。 因 为 是 按 列 平衡 的 ， 因 此 在 ACE 上 把 通常 
的 Gerschgorin 结果 应 用 于 B7 而 不 是 8 本 身 是 方便 的 。 但 是 我 
们 这 里 是 用 习惯 的 圆 盘 ， 可 以 直接 引用 先前 的 工作 。 Gerschgorin 
定理 的 直接 应 用 证 明 4 的 特征 值 落 在 中 心 为 十 Pa 十 94x， 半 
径 为 > ipi 十 邓 | 的 贺 盘 肉 ， 但 是 这 个 结果 通常 是 很 弱 的 ， 在 


ACE 上 按 下 述 方 法 使 特征 值 的 估计 得 到 改善 . 

假定 不 的 圆 盘 是 孤立 的 。 我 们 用 2 先 8 的 第 一 行 和 用 2* 
乘 第 一 列 ， 其 中 太 是 使 得 第 一 个 Gerschgorin 圆 盘 仍然 是 孤立 的 
最 大 整数 ， 按 照 我 们 的 假定 ,《 关 0, 用 这 个 多 值 ，Gerschgorin 定 
理 表明 有 一 个 特征 值 在 中 心 为 4 十 Pu 十 ga， 半径 为 

2 tpy 十 4 
的 圆 盘 内 ,所 以 更 必然 有 一 个 特征 值 落 在 中 心 后 十 Pun， 半径 为 
Igul 十 27* 己 【41 十 [2 

的 圆 盘 内 。 我 们 可 以 用 它们 的 上 界 代替 1951， 因 为 它们 比 pub 
的 平均 水 平 小 一 个 因子 2 一 

下 述 考察 提供 一 个 很 简单 的 选择 适当 的 天 的 方法 。 如 果 于 显 
著 地 大 于 1, 那 么 第 一 个 Gerschgorin 圆 盘 的 半径 约 为 

2- 2 lpsl, 
rT 


而 其 它 圆 盘 的 半径 盈 近 2*|pni。 因 此 , 在 ACE 上 首先 选 一 个 满 
足 
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0, 
一 0 
一 0. 

0. 


0.38463 

0.91066 

0.67339 

1.00000 
x 


一 09.25660 


0.32185 


一 0.10244 


根 允许 的 乘 子 
1 310 
2 
3 
4 


0.13513 


一 0.14241 
一 0.17215 

0.09990 
0-00672 


表 入 


4 
05811 一 0.1169] 0.51004 一 0.31330 
0429[ 0.56850 一 0,07041 一 0.68747 
01652 0.38953 。 0.01203 一 0.52927 
06140 0-32179 一 0.22094 一 D0,42448 
2 的 
0.59641 1.00000 1.00000 
1.00000 0.74534 0.34879 
0.81956 0.46333 0,52268 
0.23761 0.61755 0.10392 
10°F, 103, 10 L074。 
—0-06427 0.32258 0-09052 。 一 0.14193 
一 0.22972 。 0.30806 .17442 0.1341 
一 0.19421 0.13829 一 0.10132 0.05223 
一 0.12232 0.05163 = 一 0.09736 0.15437 


L 
1,00000 
0.91066 1,00000 
0.38463 0.64447 1.00000 
0.67339 0.84168 —0.16525 1.00000 
置换 行 4 2，1，3 变 为 1， 2 3 4 
vU 
1.00000 0.23761 0.61755 0.10392 
0.78362 0,.18296 0.25415 
0.64456 0D.79624 
0.37037 
10P 二 《X")7!F 的 会 人 后 的 形式 
-0,31415 一 0.11093 0.18613 
0.29352 一 0.18228 。 0.07080 | 元 素 194l 
0.52207 O06130  —0.04284 以 上 10-9 为 界 


一 0.25371 0.18010 。 一 0.21291 
特征 值 误差 界 
25660 14241 10~*#(C0.61121) + 2X 10-° 
0.32185 29352 107%0.42523) + 2X 10°* 
一 0.10243 93820 10-(0.66481) + 2X10 
3512 78709 O70.44053) + 2XX10- 


续 表 + 


4 十 CX)T'F 的 第 一 个 特征 向 部 4 的 第 一 个 特征 向 入 

1.00000 0.33462 67268 寺 12X 10- 

10°%0.29760) 4 0 0.91066 11902 上 13X10 

10 (一 0.64801) 十 7X 0 0.67339 17329 土 12X 10w 

10-(0.017162) 士 3X 10- 1.00000 00000 

2tlpn| 开罗 一 间作 一 2 .7) (64.1) 

的 最 大 整数 为 《。 这 是 一 个 十 分 简单 的 要 求 .然后 检查 第 一 个 图 
盘 是 否 孤 立 。 答 案 几 平 都 是 肯定 的 。 如 果 该 贺 盘 不 弧 立 ， 那 么 使 
4 减 小 直到 第 一 个 圆 盘 弧 立 为 止 。 只 要 对 应 的 了 的 Gerschgorin 
圆 盘 匠 立 ,用 类 似 的 方法 可 以 做 次 决定 每 一 个 特征 信 


数值 例子 


655。 在 叙述 关于 特征 向 量 的 类 似 方法 以 前 , 我 们 用 一 个 简单 
的 数值 例子 说 明 这 种 特征 信和 方法， 在 表 4 中 近似 的 特征 系 和 
民 准 确 地 给 出 所 显示 的 剩余 向 量 记 。 这 些 向 量 都 是 以 块 浮 点 寸 进 
位 形式 表示 的 。 矩 阵 X 已 经 用 带 交换 的 三 角 分 解 给 出 矩阵 工 和 
Q7, 也 记录 了 行 吐 柳 , 矩 阵 了 是 (X')-:P 的 正确 合 人 后 的 形式 . 经 
常 发 生 这 样 的 情况 , 辕 一 个 比例 因子 适用 于 P 的 每 一 列 ,未 知 矩 阵 
2 的 元 素 是 以 二 10-” 为 界 的 。 为 了 孤立 每 一 个 特征 值 采用 了 形 
如 10-4 的 因子 . 

按照 条 件 (64.1)， 算 法 的 确 在 各 个 情况 下 都 正确 地 给 出 10- 
的 最 优 值 ， 对 应 的 改进 特征 入 的 界 已 列 由 来 了 。 爹 部 计算 不 管 是 
否 适 当 都 是 用 有 内 积累 加 的 五 位 十 进位 运算 ， 并 且 还 能 给 出 合 人 
误差 的 界 ,通常 它们 是 10-" 的 数量 级 。 


特征 向 量 的 改进 


$66, 如果 8 的 特征 向 最 是 w%， 那 么 4 的 特征 容量 是 X'%。 因 
此 ,要 得 到 4 的 特征 向 量 仅 需 寻找 8 的 特征 向 量 .这 些 特 征 向 量 的 
计算 和 误差 界 的 推导 其 是 稍为 更 困难 一 些 ， 但 是 出 于 记号 比较 揽 
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条, 我 们 仅 用 数值 例子 说 明 这 个 方法 ， 假 定 我 们 有 


0.93256 
五 一 0.61321 
0.11763 


0.31257 0.41321 0.21653 
十 10 


0.41357 0.21631 一 小 40257 
0.31765 0.41263 0.71654 


+ 0, gn! < 证 10re， (66.1) 


用 特征 值 的 技术 可 以 证 明 第 一 个 特征 值 上 满足 
[me 一 493256 31257| < 10™, {66.2) 
设 4 是 对 应 的 已 规范 化 的 特征 向 量 ,其 模 最 大 的 元 素 是 1, 这 个 分 
量 必定 是 第 一 个 。 如 果 我 们 假定 它 是 第 二 个 (或 第 三 个 ), 那么 从 
Bu 一 jm 的 第 二 个 (或 第 三 个 ) 方 程 立 刻 导 出 矛盾 . 
如 果 记 wT 一 (1， ty，t)， 第 二 个 和 第 三 个 方程 给 出 
10-5(0.41375) + ga + (0.61321 21631 + qa) 
+ [—10-5(0.40257) + glus = pr, (66.3) 
10"(0.31765) + qa 十 {1075(0.41263) + gu] 
+ (0.11763 ?1654 十 qa) 一 prs, (66.4) 
因为 lml，lws| 委 1， 由 这 些 方程 和 (66.2) 并 使 用 很 粗 的 佑 计 给 
上 lml < 


1 1 
1075(0.41375) 十 友 107" 十 1075(0.40257) + 却 (107) 


多 一 一 到 10-8 一 10- 


<3X10-。 (66.5) 
类 似 地 ， 它 们 给 出 
te <2 x 10 (66.6) 
现在 用 这 些 和 粗糙 的 界 我 们 可 以 返回 到 方程 《66.3) 和 《66.4) 得 到 
更 接近 和 和 的 近似 值 。 更 简单 一 些 ,我 们 把 (66.3) 改写 为 
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(leez 到 10-0} 十 (s+ 二 1 志 


(10m 去 10- 吕 办 一 (4 十 10-9u。 (66.7 


其 中 和 * 是 1 数量 级 的 , 而 量 土 10 + 显示 了 每 个 系数 的 不 确定 
人 性， 由 《66.7) 我 们 得 


(too 译 10- 十 {10 主 10") th 
如一 如 十 10.5 x 107* 
我 们 已 知 , ws 落 在 土 2 x 10 -之 间 。 取 最 坏 的 符号 组 合 ,我 们 有 


Hy 


(66.8) 


1 加 
10e 土 二 10 十 2X 10 (- I0%e 10 


oi 105 x 10™ 
< 了 人 人 < 一 10-x(1.2957)， (66.9) 


1 1 
10%a—Z 10"—2x10 全 10 十 二 10*) 


> 
Dix 0™ 
> 070.41373) > 10-:(1.2954). (66.10) 
0.31936 
类 似 岂 ， 
10- 皂 0.38982) > us > 10-"(0.38976). (66.11) 


因此 ,我 们 得 出 这 样 的 结果 ,第 一 个 特征 向 量 的 每 一 个 分 量 的 误差 
界 小 于 2 x 10-?， 


在 台式 计算 机 上 计算 特征 向 量 不 是 特别 元 长 ， 但 是 这 种 计算 
令 人 厌烦 因此， 我 们 只 是 计算 了 第 一 个 特征 向 最 。 我 们 给 出 
和 4 的 第 一 个 特征 向 量 ， 并 且 都 带 有 误差 界 。 在 这 些 向 量 的 分 量 


申 ， 误差 界 在 十 进 制 第 9 位 都 大 于 1 二 个 单位 。 因 此 , 我 们 可 以 


设想 ,它们 在 本 质 上 是 高 估 的 。 事 实 上 ,在 任 一 分 时 的 第 十 位 上 的 
极 大 误差 是 2。 没有 非常 详细 的 误差 分 析 想 吉 免 这 种 过 高 的 估计 
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是 困难 的 。 在 一 台 像 ACE 这 样 的 计算 机 上 一 个 字 有 48 位 二 进 
位 ,在 96 位 上 上 辆 性 一 些 二 进位 数字 是 毫 无 关系 的 。 通 常 最 终 的 界 
比 我 们 需要 的 精细 得 多 。 


复 共 加 特征 值 


67， 上 一 节 的 分 析 经 过 简单 修改 后 可 用 于 揽 矩 阵 ， 除了 整个 
计算 是 在 复 域 上 进行 之 外 , 没有 包含 新 的 特点 。 当 一 个 实 和 矩阵 有 
一 对 或 用 对 复 共 斩 特 征 值 时 ,我 们 自然 希望 尽 可 能 在 实 域 上 运算 . 
这 里 用 一 个 四 阶 矩 阵 为 例 说 明 一 种 适用 的 方法 。 这 个 矩阵 有 一 对 
复 共 轿 特征 值 ,于 是 我 们 有 


Ax'—-x' | 二 FF， (67.1) 


其 中 X' 的 前 两 列 是 计算 的 复 特 征 向 量 的 实 部 和 虚 部 。 和 以 前 一 
样 ,我 们 可 以 计算 一 个 扼 阵 P, 使 得 
KAKI jrr+o, (672) 


3 


1 

其 中 了 是 明确 知道 的 ,并 且 对 于 2 的 元 素 我 们 已 给 定 它们 的 界 . 现 
在 所 有 元 素 都 是 实 的 ,如 果 我 们 令 

1 1| 1 一 1 
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+DPD+ DOD (67.4) 
和 
ppp— tx 
2 


Putpatilpapa) pu—pui(pu— pn) | Pu—ipn pu—ipy 
Pu—pati(pu—Pa) putpu—i(Pn— pr) patips, Put ipn 


pu + ipw pa — ipu 
两 个 关联 的 Gerschgorin 说 盘 的 中 心 是 
并 十 二 (十 eo)+i| 二 (pa 一 en)], 


而 且 这 些 是 改进 后 的 特征 值 。 和 以 前 的 作法 一 桩 ， 我 们 用 2“ 乘 
第 一 行 ， 用 2* 乘 第 一 列 可 以 缩小 第 一 个 圆 盘 的 半径 。 与 条 件 
《64.1) 类 似 , 我 们 现在 选择 《使 得 


十 2tpu— pst i(pu + pu)| < 2 ， 


(67.6) 
1 . . » 
Bp tt ipal < ti (> 2),. 


重 的 和 非常 靠近 的 特征 值 


68， 到 四 前 为 止 ， 对 于 那些 与 其 余 的 特征 值 明 显 分 离 的 特征 
已, 我 们 所 描述 的 方法 给 出 了 小 的 误差 界 。 随 着 两 个 或 多 个 特征 
值 之 间 的 分 离 情况 变 坏 , 误差 的 界 也 变 坏 。 这 些 界 可 以 用 下 述 方 
法 改善 。 

考 志 矩阵 (4' 十 88)。 其 中 全 是 对 角 短 阵 , 4' 和 8B 的 元 素 的 
数量 级 是 1， 假定 从 的 前 两 个 对 角 线 元 素 入 相差 6 数量 
级 。 我 们 划分 矩阵 为 下 述 形式 
五 | 


| » 《68.1) 
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如 果 我 们 令 


bu ba 
“-| (68.2) 
bn but (MU— Ni)e™ |, 
那么 (68.1) 可 以 表示 为 
和 Ca | Bow 
he ， (68.3} 
po Baa | Bo oo- 


其 中 Cw 的 元 素 是 1 数量 级 的 ， 现 在 假定 我 们 计算 Cw 的 特征 系 ， 
因此 我 们 有 


CaXn 一 Xn 性 ] + sc (68.4) 

ml 

其 中 Ga 是 数量 级 为 的 。 由 此 可 得 
XH CnXy 一 Ww | + eHs, Ha = XitGu, (68.5) 


我 们 还 预料 zs 的 元 素 是 1 的 数量 级 ,除非 Cs 是 一 个 病态 的 生 征 
全 问题 。 因 此 , 记 


一 《68.6) 
我 们 有 


Yh + eB)Y 一 - 


eH» Xa Ba,n-z 
十 8 > (68.7) 
BaraXn Be-sn-; 


第 二 个 矩阵 左上 角 的 元 素 是 中 数量 级 的 , 其 他 的 元 素 是 。 数量 级 
的 . 
现在 考虑 一 个 特殊 的 例子 。 假 定 和 矩阵 〔68,7) 为 
0.92563 41653 
| 0.92563 21756 
上 0.11325 


10-5(0.23127) 10-%(0.31257): 0.31632 
0.28316 0.10175 | 0.20375 
如 果 我 们 用 10"? 莱 前 两 行 ,用 10” 乘 前 两 列 , 那么 Gerschgorin 贺 
盘 是 
中 心 0.92563 41653 23127， 半径 10-m(0.31257 十 0.31632]; 
中 心 0.92563 21756 41257， 半径 10-*(0.41365 十 0.21753); 
中 心 0.11325 20375， 半径 (0.28316 十 0.10175)。 
现在 三 个 圆 盘 互 不 相交 , 并 且 给 出 的 前 两 个 特征 值 的 误差 是 10 
数量 级 的 。 在 这 个 例子 中 。 我 们 已 忽略 了 对 应 于 矩阵 的 误差 矩 
阵 、 联 系 我 们 过 去 的 处 理 方法 可 知 ,这 个 矩阵 的 元 素 应 是 10-* 量 
级 的 , 它 对 误差 界 的 影响 只 是 10-* 的 量 级 。 
通常 , 当 有 ~ 个 特征 值 互相 非常 接近 时 ,通过 解 一 个 独立 的 ” 
阶 特征 值 问题 , 我 们 能 够 分 辨 这 些 特 征 值 ， 这 过 程 的 运算 精度 与 
整个 间 题 的 运算 精度 一 样 。 如 果 有 两 个 或 多 个 特征 值 实际 上 重 
合 , 其 对 应 的 圆 盘 将 继续 重 登 ， 但 是 误差 界 仍 可 以 用 同样 方式 得 
到 改善 


对 ACE 程序 的 评述 


69. 在 ACE 上 我 们 已 完成 了 几 个 实现 刚才 描述 的 方法 的 程 
序 ， 这 些 程 序 的 精细 程度 是 不 一 样 的 ， 最 精细 的 程序 包含 了 这 样 
一 段 程序 , 它 比 $68 描述 的 方法 更 精确 地 分 辩 非 常 接近 的 特征 值 . 

对 于 大 多 数 和 矩阵， 即使 通常 认为 其 特征 值 分 离 度 特别 坏 的 矩 
阵 , 误 差 的 界 也 远 比 我 们 要 求 的 小 。 例如 一 个 15 阶 的 矩阵 ,元 素 
是 数量 级 为 1 的 ， 特 征 值 的 分 离 度 的 数量 级 是 10"，10-”，10 
10-5， 10-，10-3, 10-，10-5 10 10，10 一 、10 一 10 一 1， 所 有 
的 特征 值 和 特征 向 量 都 被 保证 到 十 进 制 17 位 ， 其 中 绝 大 多 数 还 
能 更 好 。 注意 ， 对 所 有 这 些 程 序 的 实质 性 的 限制 是 要 求 计算 
(KFR 要 正确 到 运算 精度 ， 随 着 X' 关于 求 逆 的 条 件数 趋向 
2:jn, 这 样 的 要 求 愈 来 愈 难以 满足 。 当 条 件数 达到 这 个 信 时 ,方法 
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失败 了 , 再 进一步 提高 运算 精度 才能 从 本 质 上 解决 问题 .在 ACE 
上 仅 当 和 矩阵 有 极 病 态 的 特征 值 时 才 发 生 和 失败 . 在 这 种 情况 下 计 
算 了 改进 的 特征 系 之 后 ,把 所 有 的 值 全 都 爹 人 为 单 精 度 , 然后 再 使 
用 该 程序 。 这 样 使 用 时 ,除了 最 后 一 步 之 外 ,在 其 余 步 中 为 给 出 误 
差 界 所 需 的 计算 被 省 略 了 ， 并 且 我 们 可 以 从 比较 差 的 特征 系 开始 
计算 ， 这 个 迭代 法 与 Magnier (1948)，jJahn (1948) 和 Collar 
〈1948) 的 方法 有 许多 共同 之 处 。 
在 这 些 方法 中 计算 由 
(XIAX’ 一 diag(1) +t P=—B (69.1) 
定义 的 矩阵 P 不 必 采 用 特别 的 措施 去 保证 精度 。 4 的 改进 特征 信 
取 为 (2 十 pn), 而 B 的 第 i 个 特征 向 量 《第 二 章 5 6) 是 
[ps/(H — 双手 一 本 
Po/ 一 为)]。 (69.2) 
于 是 , 4 的 改进 的 特征 向 量 可 按 明显 的 方式 确定 - 
上 节 的 方法 由 Wikinson《1961a) 独立 地 发 展 的， 主要 只 的 
是 希望 用 计算 的 手段 建立 一 个 严格 的 界 。 应 当 着 重 指出 : 当 用 我 
们 讨论 过 的 某 个 高 精度 方法 决定 了 一 个 近似 特征 系 时 ， 其 误差 通 
常 与 直接 应 用 (69.1) 和 (69.2) 产生 的 误差 县 级 相同 。 如 果 必须 
要 得 到 改进 的 特征 系 ， 对 ACE 程序 中 具体 处 理 的 那些 细节 予以 
关注 是 很 重要 的 . 
帆 注 
以 许多 向 量 同 时 进行 的 迭代 方法 已 在 Bauer (1957 和 1958) 
的 论文 中 撕 述 了 , 一 般 我 是 按照 他 的 处 理 来 叙述 的 。 $ 38 的 方法 
最 近 已 由 Voyevodin (1962) 讨论 。 本 章 的 大 量 材料 在 Houscho- 
lder 的 书 (1964) 的 第 七 章 中 也 讨论 过 , 在 许多 情况 中 是 用 不 同 的 
观点 来 研究 的 . 
梯级 迭代 、 正 交 化 方法 和 双 达 代 法 都 可 以 用 逆 和 矩阵 执行 。 关 


于 梯级 迭代 我 们 有 
AXin Ls Xn = LinRin, 
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显然 ，4… 不 必 明 显 给 定 ,我 们 仅 需要 执行 4 的 三 角 分 解 ,如 果 4 
是 Hessenberg 和 拢 阵 ， 这 是 特别 重要 的 。 我 们 可 以 结合 原点 移动 。 
但 是 对 于 每 一 个 # 都 楼 进行 (4 一 p1) 的 三 角 分 解 ， 再 者 仍然 有 


一 个 34 提 到 的 弱点 ，、 即 在 决定 一 个 4 的 值 之 后 不 能 自由 选择 
p. 
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